第一章 人工沟通?——算法作为互动伙伴
算法能否“思考”还很不确定,而能确定的是,基于机器学习和大数据的当代算法可以参与沟通。今天的算法可以充当沟通伙伴。尽管准确的估计是困难的,但据称机器人是大约50%在线流量的作者。数百万推特(Twitter)的用户是机器人,大多数虚假的脸书(Facebook)账户是由自动化程序创建的,至少40%的维基百科的编辑是由计算机控制的账户执行。根据牛津互联网研究所的一项评估,高度自动化的账户产生了近25%的关于2016年美国总统选举的推特流量。谷歌和脸书由算法驱动已被众所周知,自相矛盾的后果是,人类操作者在脸书的热门话题列表中引导新闻选择的“发现”(discovery)被视为丑闻。自动化系统也用于个性化沟通,在谷歌邮箱(Gmail)里,智能回复(Smart Reply)可识别需要回复的电子邮件,并即时生成完美的自然语言答案。“声田”(Spotify)最受欢迎的合辑“每周发现”(Discover Weekly)与超个性化的最新轨迹播放列表“发布雷达”(Release Radar)都完全由算法组合而成。
算法也可以是传统印刷媒体中文本和书籍的作者。“叙事科学”(Narrative Science)和“自动洞见”(Automated Insight)等公司已经开发出算法来生成与人类作者所写的文本无法区分的文本:报纸文章、商业产品手册、教科书等。枫丹白露欧洲工商管理学院的菲利普·帕克教授为一种自动制作合理且信息丰富的书籍的方法申请了专利,其中包括亚马逊网站上已有的10万多种书籍。美联社、三星、雅虎、康卡斯特(Comcast)等许多公司经常使用机器人新闻。
此外,我们经常直接与算法交谈。我们通常会通过与聊天机器人的对话来预订火车票、预约并寻求帮助。苹果的“Siri”、亚马逊的“Alexa”或谷歌助手等数字个人助理使用自然语言界面来回答新问题、管理日历或提供个人建议和推荐服务。在许多情况下,这些程序似乎比它们的人类伙伴更了解用户,而且往往比用户更了解用户自己,甚至在这些用户出现之前就预测到他们的要求和需要。
我们应该如何解释算法在沟通性能方面的这些惊人发展?我们所知道的沟通通常发生在人类之间(或最多发生在人类与其他生物之间)。如果机器现在参与了沟通,这是否意味着机器已经变成了人,或者至少它们已经学会了复制人类的智能?我们是否正在见证从一开始就伴随着数字化进程的人工智能理想的实现?还是我们面临的是不同的事物,它需要我们过渡到不同的思维方式?
在本章中,笔者认为我们在与算法的互动中可以观察到的不一定是一种智能的人工形式,而是一种沟通的人工形式。智能和沟通能力不是一回事。算法能够充当沟通伙伴——它们是否智能则是另一回事。现代机器学习算法之所以如此高效,不是因为它们学会了模仿人类智能和理解信息,而是因为它们放弃了这样做的尝试和野心,并面向不同的模型。笔者断言,使用大数据的机器学习算法不是在人工复制智能,而是在人工复制沟通技巧,它们是通过寄生方式利用用户在网络上的参与来实现的。
必须重新考虑沟通的概念。当其中一位伙伴不了解所传达的信息时,我们还能谈论沟通吗?这对社会信息处理意味着什么?在下文中,笔者试图通过检验沟通的概念并提出一个不以参与者之间分享任何想法为前提的概念,来回答这些问题。在本章的最后一部分,笔者展示了算法设计中从智能转向沟通的结果,特别是在自主学习程序的概念中。