中文搜索引擎指南网

标题: 被人用搜索引擎蹭热点的“我院”!搜索引擎那些事儿 [打印本页]

作者: sowang    时间: 2018-9-22 17:35
标题: 被人用搜索引擎蹭热点的“我院”!搜索引擎那些事儿
原创: 大东  中科院之声

一、事件始末

小白:大东东,今天我在搜索引擎上搜“中科院”,搜到了好多奇奇怪怪的网页啊,你看下面那张截图。


网友通过搜索引擎结果进入的“中科院”网站

大东:看起来还真像是中科院的官网,怎么回事?我查查,官网 www.cas.cn 没有问题,一切正常啊。

小白:大东东你用搜索引擎搜索“中科院”!

大东:嗯?我这里还是挺正常的啊。

小白:我还没说完呢,你在前面加上“diss”关键词再搜。你看看这搜到的都是些啥啊!

大东:这不搜不知道,一搜吓一跳呀。 难道“中科院”的关键词都被这些“野鸡”网站占领了?


“diss 中科院”的搜索结果第一页
 
小白:这是咋回事啊,大东东。

大东:从技术上来说,这很可能与搜索引擎的 SEO 有关。

二、搜索引擎那些事儿

小白:SEO?

大东:Search Engine Optimization,搜索引擎优化。它是一种利用搜索引擎的搜索规则来提高目前网站在有关搜索引擎内的自然排名的方式。

小白:噢,搜索结果的排序就跟这个 SEO 有关?

大东:一定程度上是的。搜索引擎根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

小白:我懂了。

大东:不过,小白,这个 diss 是啥意思?

小白:哈哈,没想到还有大东东没听过的流行语呀~这个diss呢,是英文单词 Disrespect (不尊重)或是 Disparage(轻视) 的简写。以前使用在 Hip Hop 中,rapper 之间用唱 diss 曲的方式来互相贬低和批判。去年国内某选秀节目的走红,将 diss 这个词带向了网络世界,也被用在生活中,以此表达不满。

大东:原来是这个意思。

小白:大东东,那搜索引擎在今天这件事里出了啥问题呀?

大东:你看,一旦我们在搜索“中科院”关键词的前面加上别的关键词,搜索结果排名靠前的就是一些“污染眼球”的东西,这与两个关键词的组合搜索策略有关。我们再搜索其他与“diss”组合的关键词,比如“diss 清华”、“diss 北大”,搜索结果都很正常,说明很可能有人利用了“中科院”关键词和搜索引擎策略,恶意蹭咱中科院的搜索热度。

小白:有道理!难怪搜索“16颗气象卫星中科院”也会出现这种状况!这是赤果果的蹭咱流量啊!

大东:极可能是恶意蹭流量的人掌握了搜索引擎搜索排名的策略,从而恶意利用。

小白:这种重要的策略也能轻易被人掌握!

大东:那可不,这背后很有可能涉及黑色产业,黑色产业链网站上已有不少分析提高搜索排名的文章。

三、真假“美猴王”

小白:诶,大东东你看,这些搜索出来的“野鸡”网站里,有些点进去是赌博网站,有些是黄色网站,这我都理解,只要他们把网站标题换成带有“中科院”的,就能把流量导入自己的网站。可是,还有些网站看起来就跟中科院官网一模一样,只是某些细节被恶搞了,简直真假美猴王啊。这是怎么回事?


中科院官网的镜像网站页面

大东:这是利用了网站镜像技术。网站镜像通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。

小白:竟然还有这种技术!应该不是因为恶意利用产生的吧!

大东:镜像网站存在有两种情况,一种是网站主动建立,将同一个网页内容放在不同服务器上,随时保持各个服务器上内容一致,用以对用户访问的分流。

小白:另一种就是这种恶意建立的吧!

大东:没错,这种技术也为他人的恶意复制提供了可乘之机。这有可能会导致正确网站的流量明显减少,在搜索引擎的 SEO 中排名降低。当网站被镜像后,不及时处理,时间一长很容易被降权,如果再想恢复就比较难了。

四、太上老君炼丹炉

小白:啊?那那那咱有啥应对的办法么?

大东:防止镜像的办法当然有了,最有效的办法就是屏蔽 IP,找准镜像站的服务器 IP 地址,在 WEB 服务器的配置中禁止访问,先屏蔽掉镜像网站所属 IP 的访问行为,阻止镜像站通过技术手段不断的抓取自己网站的信息。不管是 IIS、Apache 或者 Ngnix 均有相应的设置方法。

小白:噢,那其他办法呢?

大东:也可以向搜索引擎的举报平台进行投诉,你看,现在我们投诉以后,就搜不到了。记住了,如果是在百度搜索到的,可以向站长平台(http://zhanzhang.baidu.com/feedback)反馈,如果镜像站点中涉及恶劣赌博、色情内容,还可以向举报平台(http://jubao.baidu.com/jubao/)投诉。

小白:那对于各网站来说,有预防他人恶意镜像的办法么?

大东:有。站主可以改变网站程序位置,由根目录换到一级目录。因为恶意镜像只能解析 IP,而无法与目录进行绑定。此外,还可以把网站内所有路径都设置为绝对路径,这样做不仅可以最大限度的避免网站被恶意镜像,也有利于提升网站权重。

小白:噢~我造了~所以今天搜索引擎这个锅,咱中科院,不~背~

五、网络世界的陷阱

小白:天惹噜,网络世界真是陷阱重重啊!

大东:其实这在黑产很普遍,钓鱼网站、暗链、网页篡改也是常见伎俩。

小白:钓鱼网站我知道!钓鱼网站指的是伪装成其他网站的骗子网站,因为长得与原网站非常相似,很容易就骗取到用户的重要信息,通常是一些银行及电子商务窃取用户提交的银行帐号、密码等私密信息的网站。不过,这种障眼法可以轻轻松松被电脑杀毒软件查杀~


钓鱼网站

大东:小白有长进嘛,那你了解暗链和网页篡改吗?

小白:这个这个...还是大东东给我讲讲吧~

大东:其实“暗链”就是看不见的网站链接,“暗链”在网站中的链接做得非常隐蔽,短时间内不易被搜索引擎察觉。它和友情链接有相似之处,可以有效地提高网页的网页等级值,提高网站的排名。

小白:那要是暗链被坏人利用了呢?

大东:那就是“暗链攻击”了,黑客通过隐形篡改技术在被攻击网站的网页植入暗链,这些暗链往往被非法链接到色情、诈骗、甚至反动信息。

小白:哦!难怪有时候我想要在网页里查点资料,却总有些奇怪的网页或者弹窗冒出来,原来就是暗链啊!

大东:没错。而网页篡改是黑客针对网站程序漏洞,向其植入木马,篡改网页,添加黑链或者嵌入非本站信息,甚至是创建大量目录网页。一旦网站信息被篡改,搜索引擎和安全平台会检测到该网站被挂马,会在搜索结果提示安全风险,搜索引擎和浏览器有可能对访问的用户进行拦截。

小白:真是岂有此理!真想把这些坏蛋都揪出来!

来源:中国科学院计算技术研究所





欢迎光临 中文搜索引擎指南网 (http://sowang.com/bbs/) Powered by Discuz! X3.2