【摘要】 通过对ChIP-Seq数据的初步分析可以确定ChIP-Seq实验在基因组上的富集区域,而对这些富集峰进行准确的注释可以帮助人们更好的理解这些信息。
通过对ChIP-Seq数据的初步分析可以确定ChIP-Seq实验在基因组上的富集区域,而对这些富集峰进行准确的注释可以帮助人们更好的理解这些信息。目前有很多实验室都开发了峰注释的软件,例如Cisgenome是一款综合性的分析软件,不仅可以分析ChIP-Seq数据,还可以分析ChIP-Chip数据。欧洲生物信息研究所(EMBL-EBI)Bertone实验室开发了一系列对峰进行注释的软件,比如PeakAnalyzer、PeakAnnotator和PeakSplitter。针对每个峰,峰注释软件可以在下游找到离它最近的基因和最接近的转录起始位点。
找到与“峰”关联的基因后,对关联基因的GO注释和Pathway分析也是ChIP-Seq数据后续分析很重要的一个部分。如果一群基因受同一个转录因子的调控或者它们具有相同的表观修饰,那么就可以通过GO(Gene Ontology)或者KEGG(kyoto encyclopedia of genes and genomes)数据库对它们进行注释,从而考察这些跟“峰”关联基因的共同属性,比如基因产物的相关分子功能,生物学途径,细胞学组件。GO术语和注释使用了多种不同的工具软件,它们都可以在web方式的“GO浏览器”下“GO software page”中找到。大多数GO浏览器都是web模式的,允许直观地看到术语和其相关信息,如定义、同义词和数据库参考等。有些GO浏览器如AmiGO和QuickGO,可以看到每个术语的注释。
对于转录因子,最常见的分析就是从峰序列里找到其结合基序,从而理解基因的调控。基序是指生物序列中具有特定保守功能的信号位点(Site)或模式(Pattern)。目前人们发现的基序多出现在TSS上游,长度为5~30个碱基。
免责声明:部分文章整合自网络,因内容庞杂无法联系到全部作者,如有侵权,请联系删除,我们会在第一时间予以答复,万分感谢。