1700518236
天才与算法:人脑与AI的数学思维 人工智能新闻
1700518237
1700518238
人工智能新闻报道算法的核心是如何将未经处理的原始数据转换成新闻报道。遍布世界各地的各大公司每周都会发布有关收益的数据。过去,像美国联合通讯社(以下简称“美联社”)这样的新闻机构必须指派一大批记者去仔细研究这些数据,然后编写一份关于这些公司经营状况的报告。这项工作非常烦琐和乏味,效率很低。一年之内,你只能覆盖约1000家公司,这意味着很多人们感兴趣的公司没有被报道。办公室里的记者都很害怕被选中写这些报道,它们成了记者的梦魇。
1700518239
1700518240
因此,很少有记者为美联社决定使用机器来帮助报道这些新闻持反对意见。像“Wordsmith”这样的算法,具有自动化的洞察力、科学的叙事能力,现在正被应用于基于大量数据的分析报道的撰写工作。相较于过去的人工撰写,它真是再合适不过了。在大部分情况下,只有读到文章末尾处的署名时,你才会发现这篇文章是机器写的。这些算法解放了记者,让他们可以去撰写更重要的新闻。
1700518241
1700518242
数据挖掘算法对美联社的报道很重要,对企业来说也越来越有用。算法可以获取大量的商业信息,并将不能直观读取的电子表格转换成即使是普通的公司职员也能够理解的新闻报道。算法不仅可以统计出公司或员工的工作绩效数据,还可以依据月度数据的细微变化进行预测。这些隐藏在电子表格或各种图表中的细微差别很容易让人们忽略,但一旦它们被机器以自然语言的形式解释出来,就会很容易引起共鸣。对于希望把握公司潜在估值和变化的投资者来说,这些信息描述尤为重要。
1700518243
1700518244
此外,这些算法还会参考读者的阅读喜好,生成那些像是蹲在家里就能写出来的、深受大众喜爱的、在小报封底上读到的那种武断又充满讽刺意味的体育新闻,或者带有政治偏见的报道。以地方新闻机构拥有的记者人数来看,其覆盖不了所有的比赛,因此越来越多的记者开始使用算法将足球或棒球比赛的结果变成可读性强的新闻报道。除此之外,曾经对机器替代自己工作而感到恐慌和震惊的一些记者也开始尝试借助算法去生成清晰的新闻报道。有这样一个例子,乔治·华盛顿大学体育网站上的一篇报道中,并没有赞颂对方投手的表现,哪怕是他拥有9局淘汰了27名击球手,确保无一人上垒的完美战绩。这让记者们认为,由于这一结果太过罕见,算法无法通过编程来进行报道。
1700518245
1700518246
但事实上,这篇文章是由人撰写的。他本身可能支持惨败的球队,所以就带有倾向性地将比赛结果隐藏在文章的倒数第二段。研究叙事科学性的团队饶有兴致地将此次比赛结果作为参数输入算法,想要看看它会如何处理。以下内容是仅依靠文中给出的数据生成的文章开头部分:
1700518247
1700518248
星期二对于罗伯茨来说是一个伟大的日子,这位年轻的投手在比赛中表现完美,帮助弗吉尼亚队在达文波特球场以2比0战胜乔治·华盛顿队。27个主场队员来到棒球场上,这个弗吉尼亚投手战胜了他们,在比赛中表现完美。在这场由他掌控的令人难忘的比赛中,他击败了10个击球手,让瑞恩·托马斯在决赛中出局。
1700518249
1700518250
此次报道,算法得1分,记者得0分。
1700518251
1700518252
除了现实生活中的体育赛事,越来越多的新世代球迷开始热衷于在梦幻棒球游戏(Fantasy Baseball)中组建自己的虚拟球队。在美国和加拿大,有近6000万人选择该游戏中的美国职业橄榄球大联盟(NFL)的虚拟球员组成球队,与他们的朋友比赛。他们平均每年要花29个小时来管理自己的球队。雅虎已经开始使用“Wordsmith”从每周生成的NFL虚拟球队数据中生成个性化的新闻。人类不可能花费大量的时间,每周创造出数百万条新闻,来满足游戏玩家了解自己的虚拟球队在比赛中的表现的欲望。
1700518253
1700518254
当然,任何事物都有两面性。通过算法生成的新闻报道获取信息也有不好的一面。历史一再提醒我们,故事是一种强大的政治工具。近期的研究告诉我们,数据和证据很少能改变人们的想法,只有当它们被编织成一个故事时,才有足够的说服力去改变人们的想法。就像某些觉得给孩子接种疫苗会非常危险的人,很少会被疫苗能够有效预防疾病传播的统计数据说服。但是当你给他们讲了一个人因为没有注射疫苗而得了麻疹或天花的故事,再把这个故事和数据结合起来,就有可能引起他们的重视。正如乔治·蒙贝尔特(George Monbiot)在《走出废墟》(Out of the Wreckage)中所说的:“取代一个故事唯一的办法,就是讲述另一个故事。”
1700518255
1700518256
像剑桥分析公司(Cambridge Analytica)这样的企业也已经开始“无情地”利用新闻故事来改变人们的观点了。他们通过一款名为“这就是你的数字生活”(This is your digital life)的应用程序,收集了8700万位Facebook用户的个人信息,用于开发人的“心理学档案”,然后通过与新闻报道进行比对,影响选民在选举中的抉择。起初该算法随机分配新闻故事,但它会逐渐了解到哪些故事可以吸引更多的点击量。
1700518257
1700518258
他们很快发现,美国那些思想保守的白种年轻人对“抽干沼泽”“筑起高墙”之类的短语反应积极。因此,算法将自己生成的这类故事推送到他们的Facebook页面,以满足其对这类新闻的胃口。算法所做的,就是确保这些故事能出现在最可能受其影响而改变观点的人面前,而不是浪费在其他人的身上。
1700518259
1700518260
剑桥分析公司实际上操纵了选民。该消息传出后,公众的强烈反应令该公司陷入困境。更具讽刺意味的是,这恰恰揭示了该公司的宗旨和核心价值——新闻故事对事件的影响力。
1700518261
1700518262
尽管剑桥分析公司已经倒闭,但仍有许多公司在继续挖掘数据,为那些愿意付钱的机构或个人提供战略决策。值得注意的是,倘若我们想要为生活保留一点控制权,就需要了解我们的情绪和政治观点是如何被这些算法摆布的,以便在外部信息相同的情况下,能够根据自己的情况去进行判断。
1700518263
1700518264
在这里我必须承认一点,这本书不全是我自己写的。我向罗尔德·达尔的“伟大的自动语法分析器”的最新版本“屈服了”。这本书有一个350个单词的段落是由算法编写的,该算法可根据输入的关键字自动生成短篇文字。它通过文学版图灵测试了吗?你有注意到吗?[1]
1700518265
1700518266
允许算法基于现有文本生成文章所带来的风险,当然就是剽窃。这个算法可能会给我带来麻烦。我设法在网上追溯,终于在另一个网站上找到了一篇文章,与它生成给我的段落有一些惊人的相似之处。倘若因为剽窃文章而被原作者起诉,人们就会觉得人工智能生成的文章并不像想象的那么好了。
1700518267
1700518268
尽管算法具有可变性和创新性,但目前就讲故事的算法而言,它们并不会威胁到作者——“伟大的自动语法分析器”仍然是人类的幻想。即便是数学家之间讲的逻辑故事,也是人类思维的专属品。既然有这么多故事可以讲,那么选择哪些故事仍然是一个问题。只有人类创造者才会明白为什么另一个人的大脑会跟随他们的创造之旅。毫无疑问,计算机一定会在创造的旅途中为我们提供帮助,但它可以成为的是望远镜或者打字机,而不是故事的讲述者。
1700518269
1700518270
[1] 对于读者来说,本书中文版已经过了翻译,故无迹可循了。——译者注
1700518271
1700518272
1700518273
1700518274
1700518276
天才与算法:人脑与AI的数学思维 第16章 为什么要创造:思想的交流
1700518277
1700518278
道格拉斯·霍夫斯塔特
1700518279
1700518280
创造的精髓无关机械,但每一个创造的结果都需要机械来实现,这解释起来并不会比解释打嗝更简单。
1700518281
1700518282
计算机是扩展人类智慧的强大工具。在围棋比赛中,它帮助我们发现了新下法,扩展了棋路。爵士音乐家们从算法生成的爵士乐中听到了在他们潜意识中出现但并未实现的音乐。以往人类无法驾驭的数学定理,现在依靠算法也变得唾手可得。生成式对抗网络算法已能创造出可与国际艺术博览会展出的艺术作品相媲美的作品。回顾我的研究生涯,至少目前计算机还没有产生对人类创造力构成威胁的任何东西。
1700518283
1700518284
在我的经历中,我一直都举棋不定,我曾经坚信算法永远不会生成水平接近人类所创作的绘画、音乐、文学作品,也曾意识到艺术家的行为在某种程度上是依赖于其自身的“算法”对周围世界所做出的响应。机器能否轻易拥有依赖人类思维和智慧所产生的丰富而复杂的响应能力?人类的思维和智慧已经进化了数百万年,问题是,这种进化能以多快的加速度发展?
1700518285
[
上一页 ]
[ :1.700518236e+09 ]
[
下一页 ]