几百万条数据，Contains结果太少， like '%%'效率太低，如何解决？只能使用分词系统？有没有跟好的办法？ - C# 论坛

| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛 |

编程论坛 → .NET专区 → 『 C# 论坛』 → 几百万条数据，Contains结果太少， like '%%'效率太低，如何解决？只能使用分词系统？有没有跟好的办法？

我的收件箱(0)

欢迎加入我们，一同切磋技术

共有 3853 人关注过本帖

标题：几百万条数据，Contains结果太少， like '%%'效率太低，如何解决？只能使 ...

取消只看楼主加入收藏

sw4433

等　级：新手上路
帖　子：65
专家分：0
注　册：2009-5-24
结帖率：44.44%

楼主

已结贴√ 问题点数：20 回复次数：4

几百万条数据，Contains结果太少， like '%%'效率太低，如何解决？只能使用分词系统？有没有跟好的办法？

在C# vs2008 中如何使用分词系统？
最好有详细的步骤
几百万条数据，
建立索引了，Contains (title, ''中国'' )查询结果太少了，跟like '%%'没法比

但sqlserver2005 中 like '%%' 效率太低了，全表扫描，时间长，耗内存！

有没有好的办法解决这个问题？
winform 或者中如何使用分词系统？

KTDictSeg是一个开源分词组件,不知道怎么样?

[ 本帖最后由 sw4433 于 2010-10-26 12:34 编辑 ]

搜索更多相关主题的帖子: 分词　 Contains　like　效率　系统　

2010-10-24 14:36

sw4433

等　级：新手上路
帖　子：65
专家分：0
注　册：2009-5-24

第 2 楼

得分:0

看着头有点晕，但是好像还是不知道怎么在项目中使用？以下是底层的一段代码

程序代码：

#region 根据内容搜索新闻
        /// <summary>
        /// 根据内容搜索新闻
        /// </summary>
        /// <param name="content">新闻内容关键字</param>
        /// <returns></returns>
        public DataTable SelectByContent(string content)
        {
            //TODO:根据内容搜索新闻
            DataTable dt = new DataTable();
            string cmdText = "news_SelectByContent";//存储过程 条件为：where n.content like '%' + @content + '%' （content为参数）
            SqlParameter[] paras = new SqlParameter[]{
                new SqlParameter("@content",content)
            };
            dt = sqlHelper.ExecuteQuery(cmdText,paras,CommandType.StoredProcedure);
            return dt;
        }
        #endregion

就是不会在项目中使用
怎样改？

2010-10-25 21:15

sw4433

等　级：新手上路
帖　子：65
专家分：0
注　册：2009-5-24

第 3 楼

得分:0

以下是引用wyalwy在2010-10-25 21:50:41的发言：

什么东东！晕

分词系统，跟google搜索差不多的东西，就是不会使用

2010-10-25 22:05

sw4433

等　级：新手上路
帖　子：65
专家分：0
注　册：2009-5-24

第 4 楼

得分:0

以下是引用c1_wangyf在2010-10-26 08:48:18的发言：

2楼给的是非常专业的，但是看你的要求好像是查找数据库里面的内容，这个like%%完全是数据库领域的，和分词关系应该不大。你只要了解数据库查询语句就基本差不多了--可能觉得运行起来不够快，可以试着把“条件范围”锁定的更小一点！！