宝玉

专注于web开发技术
随笔 - 114, 评论 - 1517 , 引用 - 583

AspNetForums2.0的检索

 

很多人反映2.0不能检索中文,其实不是这样的,简单介绍一下AspNetForums2.0的检索原理:

首先,有一个定时器每隔一段时间(默认是15分钟)从帖子中提取一部分帖子,将其中的内容按单词分割,比如:一个ID是111的帖子里面出现了“I love you”,那么将自动将句子分解成一个个单词:"I","love","you",并分别将这些单词、单词对应的hashcode、帖子ID等信息存储到forums_SearchBarrel中,同时将该帖标记为IsIndexed。检索的时候,比如你检索"love",则将"love"的hashcode算出,和forums_SearchBarrel表中的WordHash字段进行比较,如果相等则取出帖子ID。

由于中文比较特殊,比如"I love you"在英文中根据空格可以分成三个单词,而中文的"我爱你"却只能连在一起。所以目前检索的时候,只能根据整句内容来进行检索。

简单说明一下,具体你可以看源码,我将在《Asp.Net Forums2.0深入分析》中结合源码详细说明一下,并给出中文检索的解决方案Stick out tongue

这几天在忙于将我们学校的论坛(开放实验室)导入到asp.net forums2.0中,中英文论坛差异还是有些的IndifferentIndifferent

发表于 2004年5月10日 10:08

评论

# re: AspNetForums2.0的检索

辛苦了!
2004-5-10 22:13 | webcopy

# re: AspNetForums2.0的检索

佩服。

请教如果与您联系?

能不能介绍一点怎么样对你汉化的源码建立调试环境的内容,我想学习一下论坛的东西,但是不知怎么样建立代码的调试环境。谢了。

2004-5-10 22:16 | 梦网

# re: AspNetForums2.0的检索

我想把asp.net forums的源码分析慢慢写下来:)
2004-5-11 16:39 | 宝玉

# re: AspNetForums2.0的检索

论坛源码中,到处都是contentcontainer,很难入手看啊,谁能大概解释下如何从contentcontainer开始一步一步看进去
2004-5-12 16:17 | 困惑

# re: AspNetForums2.0的检索

中文检索的问题,我测试过了,是检索不到。
2004-6-1 18:03 | Dili

# re: AspNetForums2.0的检索

我已经解决了中文检索的问题:)过些时候我发布一个中文版本,呵呵
2004-6-1 18:08 | 宝玉

Post Comment

主题  
姓名  
主页
校验码  
内容   
京ICP备 05050892号