| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1805 人关注过本帖
标题:利用c++分析生物信息学数据疑问
只看楼主 加入收藏
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
结帖率:66.67%
收藏
已结贴  问题点数:20 回复次数:36 
利用c++分析生物信息学数据疑问
各位网友,想请问是否有任何关于如何利用c++进行生物信息学分析的书刊或工具或网站,可以介绍吗?
我之前有学过perl和awk...
现在想试着学习利用c++,来进行数据分析...
多谢各位网友的分享和指导
我主要感兴趣的是如何利用c++来读取一个挡案内的数据后,并加以分析和处理...
搜索更多相关主题的帖子: 分析 信息学 
2011-06-30 10:42
lz1091914999
Rank: 14Rank: 14Rank: 14Rank: 14
来 自:四川
等 级:贵宾
威 望:37
帖 子:2011
专家分:5959
注 册:2010-11-1
收藏
得分:1 
不懂啊,我想你在这个网站里应该能找到你想要的书:http://www.

My life is brilliant
2011-06-30 13:16
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 2楼 lz1091914999
谢谢你的分享 :)
请问你对c++或生物信息学,都很了解的?
2011-06-30 15:58
lz1091914999
Rank: 14Rank: 14Rank: 14Rank: 14
来 自:四川
等 级:贵宾
威 望:37
帖 子:2011
专家分:5959
注 册:2010-11-1
收藏
得分:1 
回复 3楼 cpp_初学者
呵呵,C++略懂,生物学不懂。。。

My life is brilliant
2011-06-30 18:53
pangding
Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19
来 自:北京
等 级:贵宾
威 望:94
帖 子:6784
专家分:16751
注 册:2008-12-20
收藏
得分:1 
生物信息学分析……
估计几乎不会有书吧 c++ 和这个合在一起讲吧……
你用 perl 解决不了类似的问题,那我觉得 c++ 也会很困难。
因为解析字符串或者匹配正则表达式之类的要利用第三方库才可以,而且,你会觉得即使用库也异常的费劲。perl 里几行的代码跑到 c++ 里等价的代码要十几行,几十行都很正常。

如果你以前只学过 perl 和 awk 的话,那么 c++ 和这两种语言的区别还是很大的。也许在学的过程中阻力会比较大,要作好心理准备哦~
2011-06-30 19:35
pangding
Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19
来 自:北京
等 级:贵宾
威 望:94
帖 子:6784
专家分:16751
注 册:2008-12-20
收藏
得分:1 
如果数据量很大的话,考虑用 sql 之类的是正确的。或者找专门用来统计分析的工具也行,比如 sas, spss 之类的。专门的数学软件也可能会更好用,比如 matlab, mathematics 之类的。

当然我说的这些意见可能没什么参考价值,因为我也不懂生物信息是分析什么的。


[ 本帖最后由 pangding 于 2011-6-30 19:40 编辑 ]
2011-06-30 19:39
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 4楼 lz1091914999
呵呵,那我们互相交流下,好吗? :)
以下是一些生物信息学,常见的数据格式:
程序代码:
目的: 读取input_file内的数据后,计算共有多少个A,C,G,T(">"的内容,无需计算)
input_file
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

理想结果:
35

我使用awk的方法:
awk '$0!~">"{total += length($1)}END{print total}' input_file
35

若是利用c++,你能分享如何读取及计算出input_file内,共有多少个A,C,G,T,etc
2011-07-01 11:06
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 5楼 pangding
pangding,你好 :)
请问你对c++,是否有研究呢?
以下是一些生物信息学,常见的数据格式:
程序代码:
目的: 读取input_file内的数据后,计算共有多少个A,C,G,T(">"的内容,无需计算)
[home@cpp]cat input_file.txt
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

理想结果:
35

我使用awk的方法:
程序代码:
[home@cpp]awk '$0!~">"{total += length($1)}END{print total}' input_file.txt > output_file.txt
[home@cpp]cat output_file.txt
35

若是利用c++,你能分享如何读取及计算出input_file内,共有多少个A,C,G,T,etc
2011-07-01 11:09
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 5楼 pangding
pangding,你好 :)
请问你对c++,是否有研究呢?
以下是一些生物信息学,常见的数据格式:
程序代码:
目的: 读取input_file内的数据后,计算共有多少个A,C,G,T(">"的内容,无需计算)
[home@cpp]cat input_file.txt
>header_1
ACGTGAGAGATAGAGC
>header_2
AGATGAGATGAGAGATAGA

理想结果:
35

我使用awk的方法:
程序代码:
[home@cpp]awk '$0!~">"{total += length($1)}END{print total}' input_file.txt > output_file.txt
[home@cpp]cat output_file.txt
35

若是利用c++,你能分享如何读取及计算出input_file内,共有多少个A,C,G,T,etc
2011-07-01 11:10
cpp_初学者
Rank: 1
等 级:新手上路
帖 子:32
专家分:0
注 册:2011-6-30
收藏
得分:0 
回复 6楼 pangding
awk和perl是很容易写出其程序...
但若是挡案太大时,就需要很长的时间...
因此,我才想看,是否能用c++,加快分析的速度...
希望你对c++的了解,能互相学习 :)
真的很谢谢你的帮忙...
2011-07-01 12:00
快速回复:利用c++分析生物信息学数据疑问
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.012933 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved