| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1805 人关注过本帖
标题:利用c++分析生物信息学数据疑问
取消只看楼主 加入收藏
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
结帖率:66.67%
收藏
已结贴  问题点数:20 回复次数:18 
利用c++分析生物信息学数据疑问
各位网友,想请问是否有任何关于如何利用c++进行生物信息学分析的书刊或工具或网站,可以介绍吗?
我之前有学过perl和awk...
现在想试着学习利用c++,来进行数据分析...
多谢各位网友的分享和指导
我主要感兴趣的是如何利用c++来读取一个挡案内的数据后,并加以分析和处理...
搜索更多相关主题的帖子: 分析 信息学 
2011-06-30 10:42
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 2楼 lz1091914999
谢谢你的分享 :)
请问你对c++或生物信息学,都很了解的?
2011-06-30 15:58
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 4楼 lz1091914999
呵呵,那我们互相交流下,好吗? :)
以下是一些生物信息学,常见的数据格式:
程序代码:
目的: 读取input_file内的数据后,计算共有多少个A,C,G,T(">"的内容,无需计算)
input_file
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

理想结果:
35

我使用awk的方法:
awk '$0!~">"{total += length($1)}END{print total}' input_file
35

若是利用c++,你能分享如何读取及计算出input_file内,共有多少个A,C,G,T,etc
2011-07-01 11:06
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 5楼 pangding
pangding,你好 :)
请问你对c++,是否有研究呢?
以下是一些生物信息学,常见的数据格式:
程序代码:
目的: 读取input_file内的数据后,计算共有多少个A,C,G,T(">"的内容,无需计算)
[home@cpp]cat input_file.txt
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

理想结果:
35

我使用awk的方法:
程序代码:
[home@cpp]awk '$0!~">"{total += length($1)}END{print total}' input_file.txt > output_file.txt
[home@cpp]cat output_file.txt
35

若是利用c++,你能分享如何读取及计算出input_file内,共有多少个A,C,G,T,etc
2011-07-01 11:09
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 5楼 pangding
pangding,你好 :)
请问你对c++,是否有研究呢?
以下是一些生物信息学,常见的数据格式:
程序代码:
目的: 读取input_file内的数据后,计算共有多少个A,C,G,T(">"的内容,无需计算)
[home@cpp]cat input_file.txt
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

理想结果:
35

我使用awk的方法:
程序代码:
[home@cpp]awk '$0!~">"{total += length($1)}END{print total}' input_file.txt > output_file.txt
[home@cpp]cat output_file.txt
35

若是利用c++,你能分享如何读取及计算出input_file内,共有多少个A,C,G,T,etc
2011-07-01 11:10
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 6楼 pangding
awk和perl是很容易写出其程序...
但若是挡案太大时,就需要很长的时间...
因此,我才想看,是否能用c++,加快分析的速度...
希望你对c++的了解,能互相学习 :)
真的很谢谢你的帮忙...
2011-07-01 12:00
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 11楼 pangding
你好,版主...
以下是我要读取的输入挡案内容:
程序代码:
[home@cpp]cat input_file.txt
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA
.
.

写出的c++程序,必须符合一下的条件:
1.若是开头是">",可以直接跳过,无需计算;
2.只计算不是">"的内容.并计算出其总额;
3.将从输入挡案读取及经c++程序处理后的计算结果,存入另一个挡案;
以下是我利用awk语言,所写出的程序内容:
程序代码:
[home@cpp]awk '$0!~">"{total += length($1)}END{print total}' input_file.txt > output_file.txt
[home@cpp]cat output_file.txt
35

2011-07-01 17:20
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
以下是我要读取的输入挡案内容(挡案内容,可能会大过1GB):
程序代码:
[home@cpp]cat input_file.txt
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA
.
.


写出的c++程序,必须符合一下的条件:
1.若是开头是">",可以直接跳过,无需计算;
2.只计算不是">"的内容.并计算出其总额;
3.将从输入挡案读取及经c++程序处理后的计算结果,存入另一个挡案;
以下是我利用awk语言,所写出的程序内容:
程序代码:
[home@cpp]awk '$0!~">"{total += length($1)}END{print total}' input_file.txt > output_file.txt
[home@cpp]cat output_file.txt
35

希望各位c++的高手,可以分享如何利用c++,写出一个类型awk语言的程序...
我利用的awk语言,在读取太大的挡案时,可能会需要很长的时间 :(
因此希望各位高手的c++程序,可以加快挡案的分析速度
谢谢 :)
2011-07-01 17:27
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 14楼 玩出来的代码
你好,每行多数的可能会是A,C,G,T,N,etc...
我主要的目的,是希望利用c++来计算,除了开头有">"行的内容...
其他行,总共有多少个英文字母的总合...
eg.
程序代码:
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

以上的例子,header_1下面的行列,共有16个字母;header_2下面的行列,共有19个字母;
因此,我希望得到的理想结果是16+19= 35...
35

希望我的解释,有让你更了解的 :)
先多谢你的指导噢...
2011-07-01 21:49
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 20楼 pangding
谢谢你,pangding版主:)
可以请教你,若是用c++语言,应该如何写此程序呢?
我试着把档案该小过1GB,再做比较...
有些简单的计算,awk或许会蛮快...
但若是复杂些的计算,可能就要比较耗时 :(
我准备多些档案后,迟点再上载来,供大家讨论和分享 :)
2011-07-02 07:11
快速回复:利用c++分析生物信息学数据疑问
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.013976 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved