1,什么是Hic数据?
Hi-C是研究染色质三维结构的一种方法。Hi-C技术源于染色体构象捕获(Chromosome Conformation Capture, 3C)技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。
2,Hic数据的优势
3,目前的处理流程
图片27.png
4,分析主要工具
目前针对Hi-c数据处理的工具主要是Hic-pro和juicer
5,juicer的安装及使用
juicer由两部分组成:从原始数据到创建Hi-C文件的pipeline和后续分析工具。
测序数据的名称一定要匹配,如:
至此,juicer的安装就基本完成了
运行下面的代码,记得要根据自己的实际情况修改路径。
结果文件都放在了生成的 aligned 文件夹中,主要文件是inter.hic和inter_30.hic文件,其中的inter_30.hic 是设置了 MAPQ threshold >30 后得到的结果。
目前针对Hi-C数据的研究主要是三个方面,分别是 ,,。
功能介绍
注释TAD
注释loop
定位CTCF元件
从多个loos文件中找到不同的loop
聚合峰的分析
计算O/E的皮尔森相关系数
计算特征向量的皮尔森相关系数
.hic文件互作矩阵提取
非juicer数据转.hic文件
chromosome 染色体
x1 = y1, x2 = y2 区域范围
corner_score, contact domain 是边缘bin的可能性, 值越大, 可能性越高
Uvar, 上三角形的方差
Lvar, 下三角形的方差
Usign, 上三角形sign of the entries的总和
Lsign, 下三角形sign of the entries的总和