中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 21033|回复: 8
打印 上一主题 下一主题

MySearch -- 一个基于语义的搜索引擎

[复制链接]
跳转到指定楼层
1#
发表于 2008-4-17 10:09:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
hi,大家好:

    最近做了一个基于语义的搜索引擎-MySearch, 大家可以看看,给个评价
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
2#
发表于 2008-4-18 08:44:43 | 只看该作者
Enlish only,汗!
给出的维基百科也直接访问,这个不错
回复

使用道具 举报

3#
发表于 2008-4-18 08:58:16 | 只看该作者
搜索了几个词,发现所有结果都来自维基百科,无语!
这也叫基于语义的搜索引擎?
回复

使用道具 举报

4#
 楼主| 发表于 2008-4-18 09:43:54 | 只看该作者

第三代搜索引擎MySearch与GOOGLE、百度为代表的第二代搜索引擎的不同:

第三代搜索引擎MySearch与GOOGLE、百度为代表的第二代搜索引擎的不同:
1、第二代搜索引擎是基于关键词的搜索,而MySearch是一个基于对象及其属性的搜索,例如用户搜索"What color is the sky?",第二代搜索引擎会直接匹配包含“What、color、 is、 the、 sky”这五个词的网页,也有的搜索将“What、 is、 the”三个词忽略掉,直接匹配到包含“color、sky”两个词的网页,而搜到的网页是否包含用户要查找的内容,无从知晓;而MySearch则将其看作是搜索“sky”对象的“color”属性,只返回包含用户想要的结果的网页。
2、标红(高亮)方式不同,第二代搜索引擎是将用户输入的关键词进行标红(高亮),而MySearch则直接将用户想知道的答案进行标红(高亮)。
回复

使用道具 举报

5#
 楼主| 发表于 2008-4-18 10:59:57 | 只看该作者

第三代搜索引擎MySearch同时很好的解决了第二代搜索引擎目前面临的问题:

第三代搜索引擎MySearch同时很好的解决了第二代搜索引擎目前面临的问题:
1、搜索的准确性问题
   第二代搜索引擎是基于符号匹配的搜索,并不能理解用户输入的搜索条件,所以很多情况下,返回给用户的绝大部分是用户所不需要的。而MySearch则可以理解用户的搜索意图,直接返回给用户正确的结果。参见上面的例子。
2、重复网页的问题
   第二代搜索引擎判断重复网页的方法一般是对整个网页的内容或网页的某一特征部分进行签名,然后利用签名判断某两个网页是否是重复网页,但实际的应用效果很差,我们随便进行搜索,都会看到大量内容的重复网页。而MySearch并不在网页一级去判断是否重复,而是在对象一级判断网页是否重复,前面提到了MySearch是一个基于对象及其属性的搜索,所以MySearch的索引结构也是以对象及其属性进行存储的,如果两个网页对同一个对象的描述相同和相似,对于这个对象来说,两个网页则是相同或相似的。这种处理方式很好的解决了网页重复问题。
3、反作弊的问题
   MySearch在建索引时首先会对网页的内容进行语义分析,网页必须在语义上合理才会获得较高的排名,MySearch本身处理机制就很好的避免了作弊问题。
回复

使用道具 举报

6#
发表于 2008-4-18 15:23:30 | 只看该作者
貌似挺有个性 呵呵
回复

使用道具 举报

7#
发表于 2008-4-19 11:01:52 | 只看该作者
理论是精妙的。但现在我的问题是,MySearch,和英文的维基百科站内搜索有什么不同?MySearch有什么特点,称之为基于语义的搜索引擎?
回复

使用道具 举报

8#
发表于 2008-12-22 19:01:07 | 只看该作者

不错,但是应用怎样?可以讨论,jyamail@163.com

不错,但是应用怎样?可以讨论,jyamail@163.com, 我在做语义搜索
回复

使用道具 举报

pdkl 该用户已被删除
9#
发表于 2008-12-25 13:07:37 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-3-16 00:55 , Processed in 0.332454 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表