3月16日消息,Google搜索引擎上已登录了第 1兆个网址。但对于使用者来说,如何找到最合理且最满意的答案,是主流搜索引擎所面临的最大挑战。因此,Google已开始发展深度网络技术(Deep Web)。
据《纽约时报》报道,1 兆个网址乍看之下很多,可是这些网页内容在Google的网页上,只能呈现一些非常表面的内容。使用者无法立即获得更深入的细节,如火车时刻表、购物目录等等其它藏于数据库深处的信息,然而这也是Google搜索引擎碰触不到的。
因此针对使用者的问题,给予最合理且满意的答案,就是这个主流搜索引擎所面临的最大挑战。目前Google已开始发展深度网络技术(Deep Web)。
深度网络技术是项尚在发展中的搜索技术,将搜索的触角,深入网海中被隐藏的角落。如果Google正式启用这项技术,将大大提升搜索质量,也会因此影响很多公司商业模式。
搜索引擎多依靠Web Crawlers,自动获得所有信息之后,再以超级链接与网络联机。目前多数入口网站都仰赖这样的搜索方式。可是由于所有信息都必须先回到数据库,对于使用者的回复相当费时,因此大多只能响应关键词搜索。
为了从深度网络摘录有意义的数据,搜索引擎必须分析理解使用者的搜索字符串,并且立即安排使用者至合适的数据库。举例来说,如果使用者键入知名画家的名字,搜索引擎就能迅速连至最有可能有艺术信息的数据库。
听起来这应该是非常轻易就能达成的目标,但是实行面向上的阻碍是非常繁杂的。
Google的深度网络搜索策略,就是将一组特别的搜索程序送进网络,使用者键入关键词,然后搜索程序开始分析每个碰到的数据库内容,去找出最有可能解答使用者问题的数据库,最后推论这个数据库的类型,以便下一个拥有相同问题的使用者。
《Search Engine Land》网站执行编辑 Chris Sherman表示,Google将因此面临极大挑战。
Sherman 认为,Google一直致力于让使用者获得良好的使用经验,因此往后若做出什么改变,都必需优先考虑使用者的看法。可是在使用深度网络技术之后,除了考虑一般上网族群的使用面向外,另外在商业领域也得有所改变。
Deep Web技术可以藉由自动分析数据库及交叉引用搜索结果,来达成降低成本的目标。这当中,最庞大的工作就是连结各种异质的数据库来源。因此深度网络技术未来可能将更着力于改变商业模式,而不仅仅只是满足上网族群五花八门的需求。