中文搜索引擎指南网
标题:
MySearch -- 一个基于语义的搜索引擎
[打印本页]
作者:
mysearch
时间:
2008-4-17 10:09
标题:
MySearch -- 一个基于语义的搜索引擎
hi,大家好:
最近做了一个基于语义的搜索引擎-
MySearch
, 大家可以看看,给个评价
作者:
stonewang
时间:
2008-4-18 08:44
Enlish only,汗!
给出的维基百科也直接访问,这个不错
作者:
stonewang
时间:
2008-4-18 08:58
搜索了几个词,发现所有结果都来自维基百科,无语!
这也叫基于语义的搜索引擎?
作者:
mysearch
时间:
2008-4-18 09:43
标题:
第三代搜索引擎MySearch与GOOGLE、百度为代表的第二代搜索引擎的不同:
第三代搜索引擎MySearch与GOOGLE、百度为代表的第二代搜索引擎的不同:
1、第二代搜索引擎是基于关键词的搜索,而MySearch是一个基于对象及其属性的搜索,例如用户搜索"What color is the sky?",第二代搜索引擎会直接匹配包含“What、color、 is、 the、 sky”这五个词的网页,也有的搜索将“What、 is、 the”三个词忽略掉,直接匹配到包含“color、sky”两个词的网页,而搜到的网页是否包含用户要查找的内容,无从知晓;而MySearch则将其看作是搜索“sky”对象的“color”属性,只返回包含用户想要的结果的网页。
2、标红(高亮)方式不同,第二代搜索引擎是将用户输入的关键词进行标红(高亮),而MySearch则直接将用户想知道的答案进行标红(高亮)。
作者:
mysearch
时间:
2008-4-18 10:59
标题:
第三代搜索引擎MySearch同时很好的解决了第二代搜索引擎目前面临的问题:
第三代搜索引擎MySearch同时很好的解决了第二代搜索引擎目前面临的问题:
1、搜索的准确性问题
第二代搜索引擎是基于符号匹配的搜索,并不能理解用户输入的搜索条件,所以很多情况下,返回给用户的绝大部分是用户所不需要的。而MySearch则可以理解用户的搜索意图,直接返回给用户正确的结果。参见上面的例子。
2、重复网页的问题
第二代搜索引擎判断重复网页的方法一般是对整个网页的内容或网页的某一特征部分进行签名,然后利用签名判断某两个网页是否是重复网页,但实际的应用效果很差,我们随便进行搜索,都会看到大量内容的重复网页。而MySearch并不在网页一级去判断是否重复,而是在对象一级判断网页是否重复,前面提到了MySearch是一个基于对象及其属性的搜索,所以MySearch的索引结构也是以对象及其属性进行存储的,如果两个网页对同一个对象的描述相同和相似,对于这个对象来说,两个网页则是相同或相似的。这种处理方式很好的解决了网页重复问题。
3、反作弊的问题
MySearch在建索引时首先会对网页的内容进行语义分析,网页必须在语义上合理才会获得较高的排名,MySearch本身处理机制就很好的避免了作弊问题。
作者:
sowatch
时间:
2008-4-18 15:23
貌似挺有个性 呵呵
作者:
stonewang
时间:
2008-4-19 11:01
理论是精妙的。但现在我的问题是,MySearch,和英文的维基百科站内搜索有什么不同?MySearch有什么特点,称之为基于语义的搜索引擎?
作者:
richardjya
时间:
2008-12-22 19:01
标题:
不错,但是应用怎样?可以讨论,jyamail@163.com
不错,但是应用怎样?可以讨论,
jyamail@163.com
, 我在做语义搜索
作者:
pdkl
时间:
2008-12-25 13:07
提示:
作者被禁止或删除 内容自动屏蔽
欢迎光临 中文搜索引擎指南网 (http://sowang.com/bbs/)
Powered by Discuz! X3.2