以下是引用吹水佬在2017-1-19 07:57:52的发言:
细问:
1、TGTTTCAA不是核小体结合模体,TCTGTCAG也不是,TCGTTCAA才是,对吗?
2、最大核小体结合模体,是指在TCGTTCAA、TCGTTCGA和CGTCGACG中,最大核小体结合模体是CGTCGACG?
3、第9个碱基/字符为统计起点、以252个字符为统计窗口,这里的“第9个碱基/字符”、“252个字符”和“统计窗口”具体是指什么?
4、G+C含量,是只针对核小体结合模体统计吗?TCTGTCAG的G+C=4、TCGTTCAA的G+C=3 对吗?
回复1:第一个没问题,TCGTTCAA才是核小体结合模体,TCGTTCGA也是核小体结合模体,只要至少包含1个CG就是核小体结合模体;
回复2:核小体结合模体无大小之分,我要找的是在252个字符的统计窗口内,哪一个147个字符的区间内拥有数量最多的核小体结合模体,即最大核小体结合模体个数;
回复3:比如DNA链为:CGCCTCCCTTCCCCCTCCCCGCCCGACAGCGGCCGCTCGGGCCCCGGCTCTCGGTTATAAGATGGCGGCGCTGAGCGGTGGCGGTGGTGGCGGCGCGGAGCCGGGCCAGGCTCTGTTCAACGGGGACATGGAGCCCGAGGCCGGCGCCGGCGCCGGCGCCGCGGCCTCTTCGGCTGCGGACCCTGCCATTCCGGAGG......
将每个字母(A、T、C、G)看做一个字符,“第9个碱基/字符”即从DNA链初始位置开始第9个字符/字母(T);
“252个字符”即从DNA链的第9个字符开始到第260个字符结束,这段字符串即“252个字符”,也即一个“统计窗口”;
回复4:不是针对核小体结合模体统计,以回复3为例,是逐一统计第9个字符到第155个字符、第10个字符到第156个字符、第11个字符到第157个字符......等147个字符的区间内拥有的G和C字符的个数,然后找到哪个147区间内拥有最大的G+C个数;
统计最大核小体结合模体个数也是如此,如上所述,统计每147个字符的区间内拥有的核小体结合模体的个数,然后找到拥有最大个数的147区间;
麻烦大侠了!!不胜感激!!