| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 982 人关注过本帖
标题:共享一个不错的Lucene中文分词包!
只看楼主 加入收藏
atlantis
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2006-6-9
收藏
 问题点数:0 回复次数:0 
共享一个不错的Lucene中文分词包!
下载地址:http://www.jesoft.cn/posts/list/5.page

1.2
增加中文数字的匹配(如:二零零六)
数量词采用“n”作为数字通配符
优化词典结构以便修改调整

1.1
增加扩展词典的静态读取方法

1.0.1
修正无法识别生僻字的问题

1.0
支持英文、数字、中文(简体)混合分词
常用的数量和人名的匹配
超过22万词的词库整理
实现正向最大匹配算法
搜索更多相关主题的帖子: Lucene 中文 分词 
2006-06-09 13:54
快速回复:共享一个不错的Lucene中文分词包!
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.017427 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved