| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 7315 人关注过本帖
标题:[求助]如何统计一篇英文文章中每个单词出现的次数
取消只看楼主 加入收藏
zeno_zheng
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2007-6-29
收藏
 问题点数:0 回复次数:3 
[求助]如何统计一篇英文文章中每个单词出现的次数

新手上路,请高手指教: 如何统计一篇英文文章中每个单词出现的次数? 每个单词用空格符或标点分隔,文章可能很长,所以最好兼顾perfermance的问题.

谢谢!

搜索更多相关主题的帖子: 英文文章 单词 统计 
2007-07-02 10:21
zeno_zheng
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2007-6-29
收藏
得分:0 

to:百年不亮

3Q!
希望我没误会你的意思,但我想要统计每个单词出现的次数,而不是一共有多少个单词.

能不能用哈希表来实现呢,求高手指点迷津,给出基本思想.

2007-07-02 12:22
zeno_zheng
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2007-6-29
收藏
得分:0 

谢谢哦,有没有不用STL的解法

2007-07-02 19:13
zeno_zheng
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2007-6-29
收藏
得分:0 
to:aipb2007
谢谢你的解答. 可能是因为跨平台的原因,要求不能使用STL.

说到统计和查询的问题,个人觉得这个问题可能需要做查询的工作.因为要统计出现的每个单词,做个很简单的类作比方
class wordCounterNode
{
public:
...

private:
string word;// 记录文章里每个第一次出现的单词
int totalNum;//记录这个单词出现的次数
};

读到文章后面的单词时,需要和前面已查询过的单词比较,如果通过查询发现在文章前面曾经出现过,直接在相应的计数器上加1,如果没有,得新创建一个wordCounterNode对象,存取这个新出现的单词,并将计数器置1.如果文章中有很多个单词,在查后面的单词时,查询工作会很费时,应该会需要一个快速查询方法。个人认为如果文章中有N个单词,一般查询的算法复杂度是O(n*n),不知道对不,请指教。

这个问题只是我要解决的整个问题中的一个部分,如果太慢,会有perfermance问题。

期待大家给个思路,不胜感激。

2007-07-02 23:02
快速回复:[求助]如何统计一篇英文文章中每个单词出现的次数
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.012493 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved