搜索引擎面临的挑战
当今社会瞬息即变,只有不断的进取才能保证不落后被淘汰。不例外的,搜索引擎在它的领域仍有现在和以后将会面临的挑战。
一、 在Web发展方面。
从Web产生以来,网络中信息量几乎是以几何级数的形式递增,近几年尤其明显。原因主要有两方面:一是Web2.0的用户正在由单纯的信息消费者向生产者与消费者是的双重身份转变;二是Deep Web的发展。同时,信息的更新速度也在不断加快,研究表明,每星期将有25%的新链接产生,但一年后将只有24%的原链接存在。搜索引擎为保证正确分析页面间的链接关系,就必须不断跟踪链接结构的变化。随着网络速度的提高,信息的表现形式和种类就变的多种多样起来,比如多媒体信息的增加。目前搜索引擎大多是标注、分类查找这些资源的方法,缺乏对图像、音视频内容的直接检索,而这将在未来较长的一段时间内构成挑战。最后是SEO(Search Engine Optimization)即搜索引擎优化师的发展,他们本来的目的是使一个网站拥有较高的网站排名,但由于不道德的技术师将此技术滥用,带给用户一些不好的体验感受,浪费了用户的时间、精力,同时也使使搜索引擎的页面整合遭受到了污染,给用户产生了大量垃圾。
二、 搜索需求的发展。
随着搜索技术的不断深入,网民的要求也在不断提高,在原本基础的“准、全、新、快”要求上,我们总是希望未来的搜索引擎会更准、更全、更新、更快,这就给搜索引擎带来了一个大的挑战。毕竟用户的体验是最重要的,而这又是一个综合服务的过程。在具备上述的新的要求外,用户也希望使用更加方便和容易,更加人性化。即以后随时随地,轻而易举的可以进行搜索,如同使用电视机,洗衣机。不同的用户类群或许有不同的搜索需要,如果搜索引擎可以根据不同职业、要求、习惯反馈给用户不同内容的相同种类的信息,或是根据搜索的时间、地点、语义背景来查询反馈将会把搜索服务又加深了一步,即个性化的搜索查询。
三、 网络本身的发展。
目前随着各种客户端搜索工具的发展,及手机、PDA、平板电脑等终端设备的发展,人们会逐渐摆脱在固定的台式计算机的约束,各种嵌入式智能装备的普及也显现出了这一趋势。即以后的搜索引擎会更加专门化,这也意味着更加方便。另一方面,如我们所见的那样,整个网络的速度变的越来越快,我们原则上可以更快、更广的获取资源,页面内容的整合更新更快,用户也可以更快的下载想要的资源。但这也意味着我们的搜索引擎技术需要更大的进步来使这种设想变为可能,比如随着Ipv6的发展大力发展完善多媒体信息的搜索和使用功能。同时由于近几年无线网络的大力发展未经深度发掘的移动互联网用户远多于固定PC用户,这也是搜索引擎的面对未来的挑战之一,即开发更加适合移动设备的搜索引擎。
四、 非技术方面的挑战。
首先是知识产权的归属问题,Goole就是一个十分明显的例子,用户和作者之间想法的矛盾使得搜索引擎公司也很难做做出合适正确的决断。同时不同国家的法律政策不同就可能会导致搜索引擎的部分功能上的缺失,这会影响用户体验;若继续使用该功能则会真正意义上的触摸“底线”。最后是网络诚信的问题,比如“点击欺诈”,用户搜索时是想获得有效性更高的答案,但虚高的点击量带来的虚假排名既给用户带来了不便,也损害了搜索引擎商和广告主的利益。
综上所述的四大方面的挑战就是未来搜索引擎很可能会遭遇到的难题,如何解决这些难题也是当今搜索引擎商乃至计算机科学界所面临的挑战。
搜索引擎的应对措施
从搜索引擎的发展历史来看,我们总是会面对各种全新的难题,但同样的,解决问题的过程就有了技术的提升与进步。
一、多元化的发展。
有了挑战,面对了难题就会有了动力,在搜索引擎领域同样也有一些相对应的解决措施。面对以后形形色色的用户及各种各样的要求,搜索引擎正在逐渐细分市场,即会有多元化的方向:一方面针对普通用户为其提供大量、广泛、全面的信息检索(通用版,会自动推荐给用户结果,但由用户决断是否采纳);另一方面,真对目的明确,专业方向性较强的用户提供更加能给出精准的答案的垂直搜索系统,以便搜索引擎能更好的为不同的用户提供更好的服务(专业版,将初步搜索的结果进行深度加工处理,更具有效性和方向性)。
二、提高搜索质量。
前文已经提到了,随着Web的发展,网络上有了越来越多的垃圾信息,大大降低了搜索引擎的搜索质量和搜索效率。但同时越来越多的搜索引擎公司开始重视这一点,推出了过滤垃圾的功能,并加大了审核力度,使用全新的页面收集技术,坚决抛弃泛滥的垃圾信息。除了过滤垃圾页面之外,还会逐渐提高查询搜索的准确度。这包括获取更多用户有关查询搜索的真正目的、用途的信息以便搜索引擎反馈给用户的信息更加实用;使用正文技术将反馈结果智能分类;通过开放平台将权威数据和经过公众认证的应用与搜索引擎技术对接,实现“即搜即得即用”、“不搜即得”;使用链接结构分析进行站点或页面的类聚。
三、搜索能力的加强。
随着多媒体信息在网络上的大量涌现和网络用户对对媒体信息需求的增加,越来越多的搜索引擎开始提供多样化的搜索服务或是直接提供独立的多媒体搜索引擎,例如Goole、百度、Yahoo!等知名搜索引擎。直到今天主流的搜索引擎并未提供给Deep Web搜索功能,原因是技术的缺乏,但最近几年已经开始有公司去尝试暗网数据的挖掘,这是良好的开始,我们完全有理由相信不久的未来我们会因为它的使用而把搜索引擎的功能更好的体现出来。Archive Search功能是把用户辛苦搜索来的历史信息自动排序、自动比较与合成而不是轻易的浪费,这是十分有意义的一项功能。在未来我们的搜索引擎本身也会进化的更加强大,具有更加优秀的功能,搜索速度也会有质的提升,这对用户的使用体验也将是极具诱惑性的。