编者注:Maria Johnsen是一位备受赞誉的AI搜索引擎专家,专注于搜索引擎技术研发和市场营销相关领域。本文为BuzzFeed对她的专访,具体谈到AI的历史发展以及技术要点。
人工智能是如何形成的?
在过去的200年,哲学家们一直都在尝试理解和解决两大问题:人类意识的工作原理和非人类是否存在意识。一些哲学家偏向于被称为人工智能的计算方式。人工智能之父John McCarthy认为这是一种制造智能机器的科学和工程,属于计算机科学的一个分支,旨在让计算机、机器人以及智能化软件按照人类的智慧进行操作。
然而,针对人工智能仍然存在诸多争议,有一些科学家认为诸如爱、创造性发现和道德性选择等高度复杂的行为是远远超出机器的能力范围的。一些人甚至认为人工智能将是机器统治人类的方式。有些人则认为这不过是一个毫无意义的技术术语,只是正好组成了当今技术的重要基础,解决了计算机科学领域内的众多难题。但是AI将通过研究人脑的思考、学习和决策方式来达成解决问题的目标。
大数据在AI中扮演了什么样的角色?
大数据包含高频数字数据的数量和多样性。处理大数据需要综合编码技能、领域知识和统计技能。大数据由互联网、元数据(标签)、翻译和土耳其机器人构成。大数据本身并不是很有用。就是一堆信息而已,除非你能够找到一种方法利用它。
你无法理解大数据。我们不会有人去看一本电话簿,那是没有用的。只有你使用了,大数据才是有意义的。例如,以往没有一个搜索引擎程序员会查看数据来给出诸如房屋、狗、猫等输出,因为用户过去并不会使用这些标签。而现在,即使是我的祖母也知道如何使用标签和话题。
如今,我们每天都可以看到大数据的作用。Facebook能够处理超过400亿张的用户照片,CERN的LHC系统可以每年给沃尔玛创造出15PB的数据,可以在一小时内处理超过10亿次客户交易。
我们可以处理没有数据的大数据吗?
不,你不能。搜索引擎的工作不仅仅是索引数据。现在大家对搜索引擎收集数据这件事感到有些担忧。从安全的角度来看,这个问题通常与在系统中复制敏感文件有关。如果数据是被直接写入索引的,那么它会更加安全些,因为这些都是难以浏览和读取的二进制文件。不过其中一些信息可以被公司或政治家利用。
有关搜索系统中的隐私和搜集信息,你有什么建议吗?
创新在人工智能搜索引擎的发展中起着非常重要的作用。一个智能化的搜索引擎应该理解来自意外地点的异常处理。不幸的是,如今99.9%的搜索引擎还没有这样的系统。我所指的异常并不是在Java编程中所使用的“抛出异常”术语。
热门搜索引擎将如何在人工智能过程中演变?
目前,Google的AI流程RankBrain对领域有着非常重要的影响,预计这种影响会继续扩大。而其他搜索引擎,如必应、百度、Yandex等也开始将AI流程纳入其搜索排名中。RankBrain会使用每个查询的用户历史纪录,这意味着会有更多的信息被用于确定合适的搜索排名。
相信这些搜索引擎也将会很快追赶上谷歌的步伐。
未来AI将会如何改变搜索引擎?
对于用户来说,人工智能的发展意味着我们找到所需要的东西将会更加容易,尤其是你曾经搜索过相关信息的时候。通过结合其他技术,搜索引擎将会变得更加高效,并创建出更友好的用户界面。对于营销人员来说,AI算法让内容营销占据了主导地位。这意味着他们需要将关注焦点从关键词和关键短语上转到和用户背景和兴趣相关的内容上。由于在线业务成了网站的重点,想要吸引具有真正兴趣的潜在客户可能需要时间的积累。
虽然目前还不了解人工智能的全部影响,但是可以确定的是,它已经在决定搜索排名的算法中扮演了一定的角色。对于熟悉SEO的营销人员来说,目前对关键字的关注正在减少,急需采用其他的技巧来创造一个有效的营销策略。
人工智能如何影响语言?
为了创造出更好的翻译系统,神经语言和机器学习被大量的应用。虽然现在有很多在线翻译程序,但是大多数都会有语法错误,其数据结构也是很原始的。然而,Google创造了一种与旧版本完全不同的神经机器翻译(Neural Machine Translation)系统。我测试了一下,发现仍然会有语法问题,但是系统会逐渐学习到错误所在,并进行改善。我有时间的时候就会帮它纠正一些语法问题。不过现在依赖神经机器翻译系统还为时过早。随着人工智能的加入,经过一段时间,它将会学习到正确的语法和发音。这一点主要是因为它的神经系统主要是根据生物大脑来开发的。
你对搜索引擎和大数据有什么看法?
搜索引擎提供商已经提供了统计分析。一些搜索引擎提供商采用多种方式从每个交互中收集长期数据,并对大数据进行处理。他们创造了一种大数据处理框架,可以兼容搜索引擎。它们具有可扩展性,并可以处理极大量的内容。
如今的搜索引擎趋势是什么?
进行实时分析和搜索是搜索引擎的重要组成部分,云的出现让这一部分的实现不再是问题。云计算正在以非常深刻的方式改变着计算机世界。
目前搜索引擎趋势主要包含三部分:大数据、搜索实时个性化和机器学习。以实时个性化为例,公司可以提升客户的体验。
你对如今的搜索引擎有什么看法?它们很完美吗?
搜索引擎能够了解非常广泛和通用的信息。这就是为什么许多搜索引擎提供商会不断使用不同的算法来更新他们的搜索系统。例如,谷歌搜索可以理解诸如电影、地图、照片等请求,但是这些都不是用户所想要的。用户希望获得更多信息,而这一点谷歌搜索还无法做到。每家公司都有自己的术语和数据。当他们进行搜索时,会得到不一样的结果。如果一家网络安全公司创造了一个安全领域的搜索应用,或者一家软件公司创造了专属的搜索引擎,他们是无法找到想要的信息的。因为所有的信息都是很宽泛的。
搜索引擎可以创建一系列与查询匹配的模式。他们可以使用大数据来创建这些模式。这意味着搜索引擎应该创建与查询匹配的模式数据库。而这些在如今的搜索引擎及技术中仍是缺少的。
搜索引擎提供商应该对用户有着更好的了解。我们需要一个可以让我们能够理解的搜索引擎。所以谷歌的个性化搜索引擎仍然是原始的。但是一个个性化的AI搜索系统可以让我们不再需要输入搜索,而是以更加深刻的方式说出和接受结果。
当然,这也有一个缺点,那就是如果用户之前从未进行过相关搜索,那他们就无法找到所需的信息。由于搜索引擎几乎没有可用的信息用作参考,可能导致最终的搜索结果并不是最优化的。