| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1186 人关注过本帖
标题:没事,用vs生成了一个文本文件
只看楼主 加入收藏
wp231957
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
来 自:神界
等 级:贵宾
威 望:423
帖 子:13688
专家分:53332
注 册:2012-10-18
结帖率:99.76%
收藏
已结贴  问题点数:100 回复次数:17 
没事,用vs生成了一个文本文件
该文本文件大约3M多一点(一共10万行),再多估计操作要有问题(速度方面)

该文本文件每行31个字符(均随机产生)

接下来要做的事情:(所做的一切都是以行为单位)

1、想筛出该文件中的重复行(保证每一行都具备唯一性)
2、对筛出后的文件 以行为单位进行排序


各位大虾都说说思路,代码就不要贴了

我初步的想法是  把文件中的数据传导到数组里,处理好了 再反传回文件
不过这样做是不是太笨重了呢

搜索更多相关主题的帖子: 文本文件 
2013-08-09 10:42
小小程序猿
Rank: 11Rank: 11Rank: 11Rank: 11
等 级:小飞侠
威 望:1
帖 子:755
专家分:2785
注 册:2013-7-18
收藏
得分:13 
我能说我是来看三楼的吗??????

孤独与寂寞是催化一个人迅速成长的良药,没有之一
2013-08-09 11:07
peach5460
Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15
来 自:武汉
等 级:贵宾
威 望:30
帖 子:2780
专家分:6060
注 册:2008-1-28
收藏
得分:13 
我其实是来看四楼的...

以前我有一个类似的需求:
再grid上显示了数据库的查询信息
(无分页,记录1-10000不等)
然后用户随意修改后回存数据库时需要做重复性判断...

我没有想到很好的处理规则...
我当时是把,所有的cell取出来拼成string
然后std::set<string>里面insert判断返回值...

上面的过程我尽量优化了...
还是存在一定的效率问题...

见:https://bbs.bccn.net/thread-374170-1-1.html

[ 本帖最后由 peach5460 于 2013-8-9 11:33 编辑 ]

我总觉得授人以鱼不如授人以渔...
可是总有些SB叫嚣着:要么给代码给答案,要么滚蛋...
虽然我知道不要跟SB一般见识,但是我真的没修炼到宠辱不惊...
2013-08-09 11:31
peach5460
Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15
来 自:武汉
等 级:贵宾
威 望:30
帖 子:2780
专家分:6060
注 册:2008-1-28
收藏
得分:0 
我感觉,可以一边读文件做重复检测和插入排序

我现在很纠结的是,我不想把文本中所有的行全部取出来存到数组里...
我想可以先写一部分回去...
然后我就大脑短路了,呵呵...

我的算法功底还是太差了,回去研究算法去...

[ 本帖最后由 peach5460 于 2013-8-9 11:51 编辑 ]

我总觉得授人以鱼不如授人以渔...
可是总有些SB叫嚣着:要么给代码给答案,要么滚蛋...
虽然我知道不要跟SB一般见识,但是我真的没修炼到宠辱不惊...
2013-08-09 11:34
TonyDeng
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:贵宾
威 望:304
帖 子:25859
专家分:48889
注 册:2011-6-22
收藏
得分:13 
回复 3楼 peach5460
重点是先排序。

授人以渔,不授人以鱼。
2013-08-09 11:36
czz5242199
Rank: 11Rank: 11Rank: 11Rank: 11
等 级:小飞侠
威 望:4
帖 子:660
专家分:2400
注 册:2011-10-26
收藏
得分:13 
直接用快速排序,交换的时候注意只交换字符串的指针而不交换整个字符串
2013-08-09 11:40
czz5242199
Rank: 11Rank: 11Rank: 11Rank: 11
等 级:小飞侠
威 望:4
帖 子:660
专家分:2400
注 册:2011-10-26
收藏
得分:0 
回复 3楼 peach5460
至于你的这个问题,由于只需要找到两个相同的行就好了,直接用一个开散列的哈希表统计就好了,从你的数据量来看冲突不会很多,所以用的时间应该和遍历这个表所用的时间在一个层次上的
2013-08-09 11:46
peach5460
Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15
来 自:武汉
等 级:贵宾
威 望:30
帖 子:2780
专家分:6060
注 册:2008-1-28
收藏
得分:0 
以下是引用czz5242199在2013-8-9 11:46:02的发言:

至于你的这个问题,由于只需要找到两个相同的行就好了,直接用一个开散列的哈希表统计就好了,从你的数据量来看冲突不会很多,所以用的时间应该和遍历这个表所用的时间在一个层次上的

嗯,差不多...
我只是看到楼主写的去重复加排序,所以有感而发一下,呵呵...

我总觉得授人以鱼不如授人以渔...
可是总有些SB叫嚣着:要么给代码给答案,要么滚蛋...
虽然我知道不要跟SB一般见识,但是我真的没修炼到宠辱不惊...
2013-08-09 11:48
yuccn
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:何方
等 级:版主
威 望:167
帖 子:6815
专家分:42393
注 册:2010-12-16
收藏
得分:13 
不明观众围观

我行我乐
公众号:逻辑客栈
我的博客:
https://blog.yuccn. net
2013-08-09 12:05
TonyDeng
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
等 级:贵宾
威 望:304
帖 子:25859
专家分:48889
注 册:2011-6-22
收藏
得分:0 
用户改哪一列,就在那一列上寻找重复数据!用户在修改哪一列,程序自己是清楚的。

授人以渔,不授人以鱼。
2013-08-09 12:11
快速回复:没事,用vs生成了一个文本文件
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.016777 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved