本篇文章2795字,读完约7分钟


本文由本智能实验室(公众号smartman 163 )制造。 聚焦ai,阅读下一个大时代!

【本智能消息7月19日新闻】以下是人工智能从无法预测年俄罗斯世界杯的结果中学到的事情。

俄罗斯世界杯于7月15日星期天结束,法国成为世界冠军,克罗地亚和比利时紧随其后。 就像以前的世界杯一样,很多研究者试图提前预测俄罗斯赛场上的比赛结果。 今年,世界杯也不例外。 研究者和科学家们试图利用人工智能( ai )和统计数据预测世界杯64场比赛的结果,有多可靠呢?

“AI预测的2018年世界杯为什么不靠谱?”

本文案将讨论人工智能预测年度世界杯结果的表现。 不管你是不是人工智能行业的专家,我都会尽量让这份复印件更好读。

预测世界杯结果的方法有很多种,一种是根据球队的能力和获胜的概率用配对模拟比较所有的单人比赛。 zeileis、leitner和hornik ( )采用同样的技术,巴西预计16.6%的概率获得世界杯,紧随德国( 15.8% )和西班牙( 12.5% )。

瑞银集团( ubs )也预测了三只队伍的排名,但排名不同。 他们预测德国( 24.0% )是冠军,其次是巴西( 19.80% )和西班牙( 16.1% )。 这个模型的生成基于四个因素。 一是对elo评分系统的评分;二是世界杯前球队的表现;三是球队在前几届世界杯上取得的成绩;四是主场特征。

“AI预测的2018年世界杯为什么不靠谱?”

该模型进行了10000次蒙特卡罗模拟( monte carlo simulations )校准,揭示了球队的夺冠概率和最后5场比赛的结果。

年6月8日,多特蒙德工业大学(德国)、根特大学(比利时)、慕尼黑工业大学(德国)的4名研究者( a. groll et al .等)在arxiv上发表了关于年世界杯结果预测的研究论文。 他们采用着名的人工智能算法——随机森林( random forest )和泊松排序算法( poisson ranking algorithm )。 6月14日,在俄罗斯和沙特阿拉伯举行的世界杯揭幕战之前,这个文案在网上公布了。 他们采用了可以涵盖过去4届世界杯( 2002-)所有比赛的数据集。 他们预测西班牙将成为冠军,紧随其后的是德国和巴西。 在这三项研究中,我们提到了西班牙、德国和巴西这三个顶级球队,但顺序不同。 他们采用了三种不同的方法、数据和数据特征,但预测结果基本相同。 世界杯现在结束了。 所有这些模型都无法准确预测世界杯的结果,也没有实际发生的预测。

“AI预测的2018年世界杯为什么不靠谱?”

在这些研究中,a. groll et al等人的研究方法是我在这个行业的最爱。 首先,他们采用了良好的数据源;其次,他们考虑了多种培训的优点和参数。 第三,他们使用了随机森林的算法。 本文的其余部分将介绍数据的特征、错误以及行业失败的原因。

“AI预测的2018年世界杯为什么不靠谱?”

数据特征

a.groll et al .等人认为,考虑到经济因素(人均gdp、人口)等与球队本身相关的各种特征的体育因素( oddset概率、国际足联排名)主场特征(东道主、洲、联盟) 总结,他们为各队和各世界杯总结了16个数据特征作为考虑因素。

分类模型

正如我之前所说,他们采用了一种叫做“random forest”的方法。 这是人工智能和数据挖掘中众所周知的算法之一。 该算法基于“决策树( decision tree )”,在多个例子中决策树在数据分类中表现出了较高的性能。 他们采用泊松模型( poisson models ),根据球队现有的能力对球队进行排名。

“AI预测的2018年世界杯为什么不靠谱?”


(图1 :用随机森林算法预测的世界杯结果——来源:参考文献[3] )

预测

在完成10万次比赛模拟后,预计西班牙将有28.9%的概率夺冠,其次是德国( 26.3% )和巴西( 21.9% )。

错误

正如我们在去年世界杯上注意到的那样,不用说决赛,没有一个预测到排名靠前的队伍进入了半决赛。 根据世界杯的实际结果和预测,模型的根均方误差( rmse )和平均绝对误差( mae )计算如下:

rmse:8.052

梅: 6.468

这两个指标表明,可以整体准确地预测模型的错误和团队的排名程度。 模型不可靠,因为rmse和mae的值很高。 小组采用了16个特点和较大的数据集(收集过去4届世界杯的数据),但人工智能机器的学习(特别是随机森林)不信任结果。 本届世界杯,俄罗斯、日本、伊朗的表现明显好于预期,但德国未能晋级。

“AI预测的2018年世界杯为什么不靠谱?”


(图2 :各队在世界杯上的预测排名、实际排名、预测误差)

为什么人工智能会失败?

在人工智能和机器学习中,拥有适当的数据进行训练和建模是很重要的。 然而,在这种情况下,尽管有适当的数据、较大的数据、较好的算法和正确的参数,训练模型却表现得很少。 这个失败的原因在于我们预测的事物的性质。

“AI预测的2018年世界杯为什么不靠谱?”

世界杯和其他以人为基础的一样,在赛前(不仅仅是16分钟)和比赛中(至少90分钟)依赖于很多因素。 这就是confounding variables。 为了准确预测结果,应该模拟每场比赛的每分钟。 每个状态的结果取决于之前的状态。 这也被称为马尔可夫链过程( markov chain process )。

“AI预测的2018年世界杯为什么不靠谱?”

不准确的模拟状态容易导致比赛进行中状态的不可靠结果。

除了内部因素外,足球比赛的结果还可能受到不公平裁判员、天气、政治状况、运动员个人问题等外部因素的影响。 这些重要特征一般很少被测量或收集。 另外,总是有一点探索的机会和不明确性。 例如,出现了重要的错误和乌龙球,这是不容易预测的。 简单来说,像世界杯和人类活动这样随机动态的环境,是当今人工智能技术无法顺利发挥作用的行业。 这是一个很好的例子,必须关注人工智能在同样的动态行业中的适用性。 另外,由于有很多复杂的数据结构,面对潜在的偏见,审查训练有素的模型是非常困难的。 人工智能中存在的偏见会导致对某一特定群体的歧视性决策。 以这种预测系统为唯一标准的决策者可能会对个人和企业产生巨大的影响。 政府和公司建议使用人工智能作为随机和动态环境预测的辅助决策平台。

“AI预测的2018年世界杯为什么不靠谱?”

参考文献:

[1]zeileis,a. c. leitner,k. hornik ( ) :基于博克Maker共识模型的年度世界杯概率预测,-09实务论文,经济学和统计学实务论文,平台实证和实验经济学,伊

[2]audran、j. m. bolliger、t. kolb、j. mariscal、q. pilloud ( ) :投资与足球(特别版) :年俄罗斯世界杯、实务论文、瑞士联合银行

[3]groll、a. c. ley、g. schauberger、h. van eetvelde ( ) :年世界杯预测——基于强调球队能力参数的随机森林算法、实务论文。

(选择: medium编译:本智能参与: nariiy )

关注本智能公众号( smartman163 ),为了解读ai行业大企业的大事,新的观点得到了新的应用。

来源:安莎通讯社

标题:“AI预测的2018年世界杯为什么不靠谱?”

地址:http://www.a0bm.com/new/19454.html