Google是如何做移动搜索的(上)
长久以来Google的旗舰产品已成为我们生活的一部分。但Google并不认为搜索理所当然就应该是那样的。此文编译自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有关Google搜索变革研究的第一部分。 天为什么是蓝的? 小孩经常问这个问题,但是很少有家长在不需要帮助的情况下能回答得上。不久以前,找到正确的答案至少需要钻研百科全书,甚至还需要跑一趟图书馆。不 过最近,爸爸妈妈只需要打开电脑,Google 一下,点击链接,问题的回答就呈现在面前,然后父母阅读一下解释,再用小孩可以理解的方式阐述一遍即可。 但到了 2015,甚至这种看似快捷的过程也算不上快了。首先,在移动设备上问题的提出更有可能是通过口述而不是在搜索框敲字。其次,尽管从一堆链接排序中选择最 相关者仍然是特定查询的有效办法,那些有着明确定义问题(如天空为什么是蓝的)的人更希望马上知道答案。如果 Google 不能马上提供答案,这些人就会失望、甚至愤怒。 那么……“好吧,Google……为什么天是蓝的?” 对于 Google 最近几年对搜索进行的变革,Google 搜索团队负责人 Amit Singhal 以飞机空中更换引擎来打比方,其改动包括排名算法,添加新的企业信息,以及在用户完成问题输入前开始搜索等。除了引擎切换以外,在移动搜索即将超越桌面搜 索的大背景下,Google 也在考虑对“座舱”—使用界面进行彻底的重新设计,甚至考虑整个使命的重新定位。 搜索一直是公司的旗舰产品,搜索广告仍是公司的主要收入来源,Google 对搜索的重视跟外界对 Google 的关注点是不一样的。现在开始有人质疑 Google 搜索在走下坡路(参见Google统治终结了吗)。理由包括:1)垃圾结果太多 2)过分强调信息的更新度而非相关性等。Singhal 强烈抨击这种言论,认为说法与事实完全相反,Google 的搜索做得比 2 年前好得多,那些批评者陷入的是一股对过去的怀旧情绪。 尽管如此,Facebook 的社交网络屏蔽 Google 的爬虫抓取信息令 Singhal 感到忧心忡忡,担心封闭的网络会威胁到 Google 的地位。但事实证明他过过虑了。Facebook 的 Graph Search 仍非常稚嫩,对 Google 几乎没什么影响。微软的 Bing 在搜索质量上有得一比,但市场份额不到 1/5。在基础设施、人才厚度、经验、雄心等方面没有竞争对手可以与 Google 匹敌。G+ 尽管远未能成为引起轰动的社交网络,但的确吸引了许多搜索用户的加入。 要说到威胁,Google 搜索最大的威胁并不是来自于竞争对手,而是搜索对象的变化—从 web 迁移到了星罗密布的 app 孤岛。不过 Google 认为这种情况自己是可以克服的—毕竟开发者跟网站站长一样希望自己的信息被发现。从 2013 年秋,Google 开始设立 App Indexing 将移动 app 内的数据纳入整个索引内。现在已经有 15% 的 Android 登录用户可获得含 app 内信息的搜索结果。但是 iOS app 是一个很大的坑。 目前抓取 app 信息的挑战尚未影响 Google 的搜索统治地位。Google 每天接受的搜索查询超过 30 亿次,每年执行的搜索超1万亿次。美国 2/3 的搜索用的是 Google,在全球其他地区(中国除外)情况类似。最近 Google 搜索份额的变化只是因为Yahoo跟Firefox的默认搜索引擎交易导致的。而且 Google 还拿到了 80% 的移动搜索份额。2013 年 Google 出现了 5 分钟的中断的结果是全球流量下挫了 40%! 尽管搜索不是外界关注 Google 的热点,但它本身却正在进行稳步而密集的再造。实际上 17 年的时间里 Google 从未停止对搜索的改进,但最近几年 Google 搜索变革的速度明显加快,为的是保持领先优势。 其中的一些变化用户已经有所体会。搜索更快了、内容更新了、更加社会化了、结果呈现更加丰富了。这些变化不是一夜之间完成的,而是 Google 持续不断的升级改进的结果。Google 每周都要开搜索质量协调会,对算法进行微调。每 2、3 年都要对排名系统进行重大升级,最近一次的代号为 Hummingbird。据称过去 3 年排名系统进行的改动要比此前 13 年的加起来还要多。 Google 搜索的变革主要体现在三个方面:知识图、语音搜索和 Google Now。知识图把全球的信息组织为一个浩瀚的数据库;语音搜索把口语吸收进了搜索;而 Google Now 则提供了未问先答的能力。这三大变化都与 Google 聚焦于移动有关。 知识图谱的推出源自对 MetaWeb 的收购。MetaWeb 2005 年由知名计算机科学家与创业者 Danny Hillis 创办,2007 年推出。做的是语义网。MetaWeb 做的事情也是通过扫描互联网去回答问题,它拥有 1200 条人、地点与事物的实体记录,一度被认为是 Google 的竞争对手。不过最终 Hillis 意识到只有在 Google 的大树下自己搭建全球信息数据库的宏伟目标才能实现。而彼时尽管 Google 也提供了一些问题的直接答案,但是却无法回答“西海岸学费低于 3 万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过 40 的演员”这样的问题。双方一拍即合。 Google 意识到,事物是搜索的重要部分,而让大众关心的事物的事实与信息迅速呈现是一种很好的方式。于是在 MetaWeb 的基础上,2012 年 5 月,Google 推出了提供搜索主体关键事实的知识图作 为搜索的辅助呈现在搜索结果页面的右侧。现在它的条目已经超过了 5 亿。那么那些搜索结果会出现知识图呢?Google 会将查询词条扩展为其他形式和同义词等等,然后进行算法测试看看是否与知识图(Knowledge Graph)结果相关,确定相关后再从中择取相关结果呈现(比方说敲“达芬奇”试试)。根据估计,目前约有 25% 的搜索可唤出知识图。 在 Google 搜索与知识图整合的这 2 年多的时间里,知识图也在不断演变。原先它是静态的,但现在正慢慢吸纳 Google 搜索本身在分析用户行为方面的学习能力。比方说“谁在《太空炮弹》中饰演 Barf?”这样的问题问多了以后,知识图就知道要把演员、电影和情节等东西列进去。 此外在知识的新鲜度方面知识图也有了大幅改进。以往知识的更新最长可能需要 2 个星期。但现在系统已经能处理新闻,所以更新调整只需要几分钟。 当然,Google 的改进计划还有很多。包括增加知识域(最近添加了汽车、视频游戏、雨果文学奖得主),提供除简单事实以外更加复杂的、更主观性、模糊化的搜索结果。用户的 兴趣点就是改进的出发点。而 Google 最终想要实现的效果是,让你不仅觉得跟你对话的不是冰冷的机器,而是既无所不知又懂附庸风雅的圣人。 但这个目标目前还有点遥远。令产品经理 Emily Moxley 恼火的是,尽管现在知识图已经知道一些电视节目,但却既缺乏新剧集的信息,也不知道什么时候上映,在哪里能够看到。在知识图成为圣人之前,Google 需要要先实现这一“中期目标”。 或者这个要求还有点高。因为 4 年时间过去了,Google 至今仍未给出上述那两个类似问题(“西海岸学费低于 3 万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过 40 的演员”)的一站式的答案。知识图,任重而道远啊。 未完待续…… 原文来自:36KR 原文编译自:medium.com知识图(Knowledge Graph)
- 目前还没评论,等你发挥!