| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1224 人关注过本帖
标题:用二叉判定树存储关键字对文章分类的问题如何编码
只看楼主 加入收藏
thinkyou
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2018-1-7
收藏
 问题点数:0 回复次数:1 
用二叉判定树存储关键字对文章分类的问题如何编码
考虑以下文本分类问题:
常见的新闻报刊中文章分类,如体育,娱乐,科技,文化,军事等。每个类别可以用一组关键字(如10个)来标识,不同类别的关键字有较大差别。 有时对于某个热点话题,也可以选取一组关键字来定义一个新类别。若要检验一个文本是否属于该类别, 就查看该文本中是否包含该类别的多数(如60%以上)关键字。
为了达到较高的分类效率,采用二叉判定树存放标识类别的关键字。对于文本中每个单词搜索该二叉树,判断其是否为关键字,并统计搜索到的不同关键字。最终计算关键字的匹配率。

设计算法并实现(英文文本):
1,(先序,中序或后序)创建二叉树存储选定的一组关键字(结点数目不少于10个),关键字按次序排列,每个结点的左子树上的关键字小于该结点,右子树上的关键字大于该结点;
2, (先序遍历,二叉查找法)对于文本中每个单词搜索该二叉树,并统计找到的不同关键字。比较两种搜索方法的效率;
3,程序的输入:一个英文文本(text格式); 输出:关键字的匹配率。
搜索更多相关主题的帖子: 关键字 文章 分类 文本 类别 
2018-01-07 11:10
thinkyou
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2018-1-7
收藏
得分:0 
希望有源码提供,谢谢大佬们
2018-01-07 11:11
快速回复:用二叉判定树存储关键字对文章分类的问题如何编码
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.039619 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved