返回 中文搜索引擎指南网 首页
 

 

 

·收藏本站
·网站推广
·搜索论坛

   首 页 - 搜索引擎目录 - 搜索入门到精通 - 中国网址之家 - 搜索引擎营销 - 搜索爱好者论坛
 

百度搜索,挽救了中国教师博客

  http://www.sowang.com   2006-10-09  作者:康国平


    已经2年了,距离一个我永远忘不了的日子。2004年,中国还只有两家博客网站,大家对Blog的概念也不看好,我当时在博客中国负责内容,并开发新的服务。因为博客(Blog)最大的好处就是可以有效进行知识管理,因此2004年7月,我们着手开发教师博客和学生博客系统,并在2004年9月成功上线。这两套系统发布后,很快得到教师和学生的欢迎,第一天就有2000多篇文章发布到系统中,第二天又有将近2000篇文章发布。注册人数很快突破5000人,这么一个系统,最大的隐患就是数据的稳定。博客中国当时还没购买大容量和高档次的服务器,更未配备数据备份设备,因此只能用普通的康柏服务器来支撑上万人的应用。

     第一个礼拜,每天都有近2000条博客文章发布到教师和学生博客中。我们的技术人员一直在担心服务器硬盘的稳定,也一直在调试,让系统效率更高,用户体验更好。一个周三的晚上12点,我们的技术人员在进行日常的数据备份和更新。在进行备份之前,可能在后台进行了一次误操作,程序员本来写的一个程序脚本是往每篇文章中添加一点内容,因为语法错误,等于在后台进行了一次SQL删除操作,直接把数据库中的博客文章表中的数据全部清空了。糟糕,这可是教师博客和学生博客一个礼拜的数据。我们赶紧调出已经备份的数据,发现备份也没及时,有3天没备份。丢了近6000条数据!

    指针已经指向晚上1点多钟了,整个技术部门立即陷入绝望,谁能恢复这6000条数据?大家几乎没有了信心,数据库中清空后,当天的文档是肯定恢复不了了,丢了好几天的数据,对博客的用户体验绝对是一次梦魇。怎么办?技术部门已经没有了任何对策。谁让我们没有及时购买备份设备,谁让我们执行脚本之前没有好好检查一遍,谁让我们12点还在加班不回家好好休息?大家抱怨没有用了,只能面对现实了。我们的6000篇文章应该是丢失了。

    天无绝人之路,幸好还有百度!

    “用百度,用百度快照!”我们的一个程序员突然冒出的这个想法,彻底挽救了刚刚处于婴儿期的教师和学生博客。结果也证明,我们的这一套方法不光管用,最终还给用户带了了良好的用户体验,数十万名教师和学生,最后都很好地用上了这套博客系统。

    Baidu是全球收藏中文网页最多的网站,而且也是收录中文网页速度最快的网站,数据库更新快,搜索准确,并且提供网页快照功能。当时就是因为有这个快照功能,直接让我们最终挽救了6000条数据中的5000多条。而用户在我们手动恢复了这5000多条信息后,几乎没有感受到太大的问题,他们甚至没觉得丢失了太多的文件,最终平稳度过了数据丢失的危机。

    因为当时只是一条SQL语句错误,删除的是文章内容字段中的信息,所有的标题和索引都还在,每个用户所发文章的标题都还留在系统中。我们技术人员首先制作出一套软件,每次将文章的标题拷贝到专门的输入框中,实际上网页执行了一个向百度进行站内搜索的命令。类似于搜索“[title] sites:js.blogchina.com”的命令,很快百度就返回了结果。通过取出百度“网页快照”中的内容,我们把内容再通过一个输入框,重新输入被清空的字段中。当时博客中国所有的编辑和技术人员都在加班手工抢救数据,前台是我们大家的努力工作,后台却是百度的服务器在努力工作。

    还好,有365天不知疲倦的百度在默默地为我们工作。在经过2天的手工搜索并恢复数据的过程中,我们的编辑和技术人员手都累麻木了,很多人在搜索结果和查看网页快照的过程中,几乎成了一种条件反射了。大家看到信息显示在百度的页面中,都会自然地露出微笑。每当每找回一篇文章,大家都会念一声,“百度真好”,每完成一个用户所有数据的恢复,大家都会念一声,“百度真牛”。谢天谢地,经过2天的搜索工作,丢失的5000多条信息最终成功挽救了80%以上,还有的数据实在因为百度搜索收录都没来得及做,我们只好麻烦用户自己更新了。因为最新丢失的,5000多用户平均下来,大概3人有不到一条信息,很多用户非常理解博客中国当时丢失数据的心情,很快就根据文章的标题,自己给补充回来了。

    有百度来做当时尚属稚嫩的教师博客的后盾,这么一次大的数据丢失事故并无造成特别大损失,轻松化险为夷。正因为百度搜索能够先一步考虑用户的需求,给每个重要的数据进行了页面快照,而且以最快的速度进行索引库的更新,才让我们得以用最原始的“搜索”办法挽救了数千条文章的数据。当时我们的共同心声就是,“幸好有百度!”

    我们的技术人员通过这次深刻的教训,更加注重了数据的备份。博客中国也从一个很小的博客服务提供商,最终发展成中国最大的博客网站。2005年后,博客中国获得1000万美元的投资,有更多的资金投入购买服务器,招聘了更多的技术人员,服务更加到位,用户体验逐步增强。但我们最早的一批技术人员和编辑,应该永远不会忘记在抢救教师博客数据的这次事故中,百度(baidu.com)所发挥的作用。

    当然,大家都知道,百度独立发展六年所付出的努力,不光是替我们这些不小心删除了的信息作了备份服务,它还提供了其他更多更好的服务。窥一斑而知全豹,两年后,当时公司的最大一次数据丢失事故,在我看到一次百度征文活动的时候想起来、提起来、写出来,会更有意义吧。现在百度也在做博客,我相信有这样强大的搜索系统,数据的安全有保证后,真正通过百度博客进行深度沟通的愿望,也一样可以得到保证。

    把这次快乐而痛苦的工作插曲写下来,我似乎又回到了两年前,感受奇妙无比。窗外蓝天白云,我则心情通畅。

 

 


Copyright © SoWang.com.All Rights Reserved
中文搜索引擎指南网
 版权所有