|
网站首页
|
业界新闻
|
小组
|
威客
|
人才
|
下载频道
|
博客
|
代码贴
|
在线编程
|
编程论坛
|
登录
注册
短消息
我发表的主题
我参与的主题
我收藏的贴子
我上传的附件
我下过的附件
编辑个人资料
我的博客
用户控制面板
搜索
道具
恢复默认风格
碧海青天
秋意盎然
棕红预览
粉色回忆
蓝雅绿
紫色淡雅
青青河草
e点小镇
橘子红了
红红夜思
水晶紫色
雪花飘飘
新年快乐
风格
短消息
论坛展区
帮助
编程论坛
→
开发语言
→
『 JAVA论坛 』
→ 共享一个不错的Lucene中文分词包!
我的收件箱(0)
欢迎加入我们,一同切磋技术
用户名:
密 码:
共有
982
人关注过本帖
标题:
共享一个不错的Lucene中文分词包!
只看楼主
加入收藏
atlantis
等 级:
新手上路
帖 子:2
专家分:0
注 册:2006-6-9
楼主
收藏
问题点数:0 回复次数:0
共享一个不错的Lucene中文分词包!
下载地址:http://www.jesoft.cn/posts/list/5.page
1.2
增加中文数字的匹配(如:二零零六)
数量词采用“n”作为数字通配符
优化词典结构以便修改调整
1.1
增加扩展词典的静态读取方法
1.0.1
修正无法识别生僻字的问题
1.0
支持英文、数字、中文(简体)混合分词
常用的数量和人名的匹配
超过22万词的词库整理
实现正向最大匹配算法
搜索更多相关主题的帖子:
Lucene
中文
分词
2006-06-09 13:54
举报帖子
使用道具
赠送鲜花
1
1/1页
1
快速回复:
共享一个不错的Lucene中文分词包!
数据加载中...
关于我们
|
广告合作
|
编程中国
|
清除Cookies
|
TOP
|
手机版
编程中国
版权所有,并保留所有权利。
Powered by
Discuz
, Processed in 0.025400 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved