1700518199
1700518200
西蒙·科尔顿是“绘画傻瓜”代码的编写者,也是Whim项目的协调人。他与伦敦帝国理工学院(Imperial College London)的斯蒂芬·马格尔顿(Stephen Muggleton)联手对上述问题进行了探索。他们开发的算法基于现在已经公认的数学成果,验证能否激发出新的想法。科尔顿在访问量最大的数学网站之一“整数序列在线百科全书”[2] (The On-line Encyclopedia of Integer Sequences)上发布了这一算法。该网站的发起人是尼尔·斯洛恩(Neil Sloane),其目的旨在收集所有有趣的数列,并探索生成这些数列的公式或方法。该网站包括一些经典的数列,比如:
1700518201
1700518202
1,1,2,3,5,8,13,21……
1700518203
1700518204
所有读过《达·芬奇密码》的人都会认出这就是著名的斐波纳契数列——数列中的每个数都是由其前面的两个数字相加而生成的。又如:
1700518205
1700518206
1,3,6,10,15,21……
1700518207
1700518208
这个数列被称为三角数,即正整数前n项之和构成的数列。
1700518209
1700518210
你还会发现数学书籍中最神秘的序列之一:
1700518211
1700518212
2,3,5,7,11,13……
1700518213
1700518214
这是由素数(或者说除了1和它本身以外不再有其他因数的自然数)构成的数列。对于该数列,很难找到一个通项公式来生成下一个数,这也是数学界公认的未解之谜之一。如果哪天机器算法攻破了这一难题,我想我们就都可以卷铺盖回家了。
1700518215
1700518216
整数序列在线百科全书数据库也包含了令我如醉如痴的数列,即编号为A158079的数列:
1700518217
1700518218
1,2,5,15,67,504,9310……
1700518219
1700518220
这些数字分别是31、32、33、34、35、36、37阶对称群拥有的对称性元素个数。我的研究表明,它们遵循类似斐波纳契数列的规则,但我仍在这些已有的数字中寻找一种特定的组合方式,以便得到该数列的下一个数字。
1700518221
1700518222
科尔顿决定用他的算法来实现对新数列的识别和解释。科尔顿的同事托比·沃尔什(Toby Walsh)提出了一个名为“可重分解因子数”[3] (refactorable numbers)的概念,其定义为:数列中每个数字的因数个数,本身又是该数字的因数(比如,数字9的因数有3个,而3本身又是9的因数之一)。该数列中的奇数,被称为“奇数可重分解因子数”[4] (odd refactorable numbers,这个叫法听起来或许有些奇怪)。算法推测:所有的奇数可重分解因子数都是完全平方数。虽然没能证明这一点,但算法提供的这个建议已然足够引起科尔顿的兴趣。他证明了这命题,并发表了一篇期刊论文来解释具体证明的过程。可以说,可重分解因子数是一项由机器生成的发明。它是伟大的“自动化”数学家这颗新星从地平线上冉冉升起的第一个迹象吗?
1700518223
1700518224
[1] 黎曼几何研究的是一个弯曲的空间,其中的直线并不是我们通常所说的直线。比如在球面几何上,两条经线是平行的,但直观上它们是相交的。——译者注
1700518225
1700518226
[2] http://oeis.org/。——译者注
1700518227
1700518228
[3] 在整数序列在线百科全书数据库中的编号为A033950。——译者注
1700518229
1700518230
[4] 在整数序列在线百科全书数据库中的编号为A036896。——译者注
1700518231
1700518232
1700518233
1700518234
1700518236
天才与算法:人脑与AI的数学思维 人工智能新闻
1700518237
1700518238
人工智能新闻报道算法的核心是如何将未经处理的原始数据转换成新闻报道。遍布世界各地的各大公司每周都会发布有关收益的数据。过去,像美国联合通讯社(以下简称“美联社”)这样的新闻机构必须指派一大批记者去仔细研究这些数据,然后编写一份关于这些公司经营状况的报告。这项工作非常烦琐和乏味,效率很低。一年之内,你只能覆盖约1000家公司,这意味着很多人们感兴趣的公司没有被报道。办公室里的记者都很害怕被选中写这些报道,它们成了记者的梦魇。
1700518239
1700518240
因此,很少有记者为美联社决定使用机器来帮助报道这些新闻持反对意见。像“Wordsmith”这样的算法,具有自动化的洞察力、科学的叙事能力,现在正被应用于基于大量数据的分析报道的撰写工作。相较于过去的人工撰写,它真是再合适不过了。在大部分情况下,只有读到文章末尾处的署名时,你才会发现这篇文章是机器写的。这些算法解放了记者,让他们可以去撰写更重要的新闻。
1700518241
1700518242
数据挖掘算法对美联社的报道很重要,对企业来说也越来越有用。算法可以获取大量的商业信息,并将不能直观读取的电子表格转换成即使是普通的公司职员也能够理解的新闻报道。算法不仅可以统计出公司或员工的工作绩效数据,还可以依据月度数据的细微变化进行预测。这些隐藏在电子表格或各种图表中的细微差别很容易让人们忽略,但一旦它们被机器以自然语言的形式解释出来,就会很容易引起共鸣。对于希望把握公司潜在估值和变化的投资者来说,这些信息描述尤为重要。
1700518243
1700518244
此外,这些算法还会参考读者的阅读喜好,生成那些像是蹲在家里就能写出来的、深受大众喜爱的、在小报封底上读到的那种武断又充满讽刺意味的体育新闻,或者带有政治偏见的报道。以地方新闻机构拥有的记者人数来看,其覆盖不了所有的比赛,因此越来越多的记者开始使用算法将足球或棒球比赛的结果变成可读性强的新闻报道。除此之外,曾经对机器替代自己工作而感到恐慌和震惊的一些记者也开始尝试借助算法去生成清晰的新闻报道。有这样一个例子,乔治·华盛顿大学体育网站上的一篇报道中,并没有赞颂对方投手的表现,哪怕是他拥有9局淘汰了27名击球手,确保无一人上垒的完美战绩。这让记者们认为,由于这一结果太过罕见,算法无法通过编程来进行报道。
1700518245
1700518246
但事实上,这篇文章是由人撰写的。他本身可能支持惨败的球队,所以就带有倾向性地将比赛结果隐藏在文章的倒数第二段。研究叙事科学性的团队饶有兴致地将此次比赛结果作为参数输入算法,想要看看它会如何处理。以下内容是仅依靠文中给出的数据生成的文章开头部分:
1700518247
1700518248
星期二对于罗伯茨来说是一个伟大的日子,这位年轻的投手在比赛中表现完美,帮助弗吉尼亚队在达文波特球场以2比0战胜乔治·华盛顿队。27个主场队员来到棒球场上,这个弗吉尼亚投手战胜了他们,在比赛中表现完美。在这场由他掌控的令人难忘的比赛中,他击败了10个击球手,让瑞恩·托马斯在决赛中出局。
[
上一页 ]
[ :1.700518199e+09 ]
[
下一页 ]