搜索引擎公司Blekko一直以致力于减少搜索结果中的垃圾信息而著称,但刚刚发布的一项新功能WebGrepper可能会成为它的一个新标志。
传统的搜索以关键字为基础搜索结果,但仍有许多信息是只依赖关键字所无法看到的,比如:“这个网站包含Like或者+1按钮吗?”“有多少网站内嵌了LadyGaGa的新歌Born This Way的视频?”或者“确定哪种信息源更受欢迎,是ATOM还是RSS?”WebGrepper就能搜索出这些信息。它可以超越关键字,直接搜索网页的HTML代码以确定相关信息,或者基于特殊话题和搜索词条进行域名匹配。这样用户就能在搜索结果中看到很多平时看不到的有价值信息了,比如广告、反向链接、cookies等以及更多隐藏在网站域名文件中的信息。
Blekko的CEO兼创始人瑞奇·斯科伦塔(Rich Skrenta)说:“我们通过WebGrepper为用户提供获得Blekko索引和不能在其他搜索引擎中得到的信息的唯一入口。”因此,从这个意义上来讲,WebGrepper的用途是非常广泛的。有评论者称WebGrepper最大意义就在于“使用户不必在一个明显自己不想去看的网站上踌躇不定”,而市场营销者可以把它作为市场分析工具来使用。
不过,也有评论者担心这样可能会给黑客攻击提供又一个可以方便获得个人信息的途径。为了防止这种攻击,Blekko将会采取人工的方式检查“greps”并监视进行搜集信用卡信息或者社会保障号码等行为挖掘的恶意数据。
超越关键字 直接搜代码
评论
8 views