| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2330 人关注过本帖
标题:怎样将重复的删去!!!!!!!
取消只看楼主 加入收藏
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
以下是引用beyondyf在2013-3-21 10:05:17的发言:

情况已经基本清楚了,近两万行数据,每行有数十个元素,近百万的数据量,如果采用基本的方法运算次数将在万亿次的量级,以个人电脑的运算速度恐怕得运行几天才能出结果。

给我点时间,我将尝试用线段树来构造算法看看效果如何。
好的,谢谢了!!!!
2013-03-21 10:15
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
以下是引用beyondyf在2013-3-21 10:17:07的发言:

有没有这样的情况,两行数据
3,5
1,10
希望得到什么结果?

呵呵,需求调查就是这样的,非常琐碎,这是程序员与用户专业的差别造成的。

最好你能将去重的规则好好整理说明一下,即使是同一组数据,去重规则不同也将产生不同的结果。就如上面的例子,如果以先占优先的规则去重将得到

3,5
1,2,6,10

而以范围大的优先来去重将得到

0,0
1,10

也许还有我没想到的,所以请你尽量详细的阐述一下你的去重要求。
3,5
1,10
改成0,0
    1,10
因为我要保证每一行的数据个数不变。
234,675
265,786改成
234,675
676,786

333,666
111,555改成
333,666
111,332

1,10
2,5改成
1,10
0,0

不仅要去除相邻重复,任何不相邻行的重复也需要去处,可能挺麻烦的,真是让您费心了!!!!

这种情况挺可怕的
1,10
2,11
3,12
4,13改成
1,3
0,0
0,0
4,13
2013-03-21 11:47
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
以下是引用beyondyf在2013-3-22 15:41:14的发言:

你这组数据让我也挺灰心的,仍然看不出一个确定的规则。还是说其实也没什么确定的规则,只要保证修改后每一行的数据个数不变就行?
还有,像
1,1
50,50
这样区间内只有一个数值的数据是否成立?

我也觉得其实没啥规律。
对,改后每一行个数不变就行,像1,1直接改成0,0就行,同时保留。
让您费心了!!!!
2013-03-23 11:23
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
以下是引用beyondyf在2013-3-25 00:23:12的发言:

楼主要正视楼上的问题,这都发生在之前我提到的行中间有一个制表符的位置。目前我先把这种数据颠倒一下顺序,有异议么?
没有异议,我也头疼了好久,想不出来了,大侠看看还有其它法吗,或者像上一楼说的合并区间,不要那些0,0了,这行的通吗?
谢谢!!
2013-03-25 12:08
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
以下是引用Knocker在2013-3-25 14:33:54的发言:

昨天试了一下,估计你上传的数据处理完需要好几小时
您好,如果我要将凡是重复的都删去,连他们的合并区间也不要,只保留没有出现过一次重复的区间,这样的程序简单吗?
谢谢!!!
2013-03-26 10:02
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
回复 41楼 beyondyf
首先祝贺您喜得贵子,是件该好好庆贺的事,祝阖家欢乐,幸福常驻!
那个问题也算基本解决了,您的编程能力真的很强,如果我能有那么优秀的编程能力就好了!!!!!
感谢您这段时间在这个问题上倾注的精力和付出,谢谢!!!!

2013-04-02 20:38
zhou31146001
Rank: 3Rank: 3
等 级:论坛游侠
帖 子:303
专家分:131
注 册:2012-11-28
收藏
得分:0 
相关基因就是一个基因名称,一般一个基因上要有几万到几十万不等个碱基(A\T\C\G),名字都是命名的。
相关基因后面的CC等实际上相当于一个二模体,那就有4的平方个情况了。

恭喜您喜得贵子。
2013-04-07 14:51
快速回复:怎样将重复的删去!!!!!!!
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.022279 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved