日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

AI預(yù)測(cè)的2018年世界杯為什么不靠譜?


AI預(yù)測(cè)的2018年世界杯為什么不靠譜?



以下是我們從人工智能未能預(yù)測(cè)2018年俄羅斯世界杯結(jié)果中學(xué)到的東西 。
2018年俄羅斯世界杯于7月15日星期日結(jié)束 , 法國(guó)成為世界冠軍 , 緊隨其后的是克羅地亞和比利時(shí) 。 就像之前的2014年世界杯一樣 , 許多研究人員都試圖提前預(yù)測(cè)俄羅斯賽場(chǎng)上的比賽結(jié)果 。 今年 , 國(guó)際足聯(lián)2018年世界杯也不例外 , 研究人員和科學(xué)家們?cè)噲D利用人工智能(AI)和統(tǒng)計(jì)數(shù)據(jù)來預(yù)測(cè)世界杯64場(chǎng)比賽的結(jié)果 , 可它有多可靠呢?
在這篇文章中 , 我將談及人工智能在預(yù)測(cè)2018年世界杯結(jié)果的表現(xiàn) 。 無論你是否是人工智能領(lǐng)域的專家 , 我會(huì)盡可能讓這篇文章讀起來簡(jiǎn)單易懂 。
預(yù)測(cè)世界杯結(jié)果的方法有很多種 , 一種方法是從團(tuán)隊(duì)的能力和獲勝的幾率上來成對(duì)模擬比較所有單場(chǎng)比賽 。 Zeileis , Leitner和Hornik(2018)使用了同樣的技術(shù) , 他們預(yù)測(cè)巴西將以16.6%的概率贏得2018年世界杯 , 緊隨其后的是德國(guó)(15.8%)和西班牙(12.5%) 。
瑞銀集團(tuán)(UBS)也預(yù)測(cè)了三支球隊(duì)的排名 , 但順序不同 。 他們預(yù)測(cè)德國(guó)(24.0%)是冠軍 , 其次是巴西(19.80%)和西班牙(16.1%) 。 該模型的產(chǎn)生基于四項(xiàng)因素:一是Elo評(píng)級(jí)系統(tǒng)的評(píng)分;二是球隊(duì)在世界杯前的表現(xiàn);三是球隊(duì)在之前的世界杯比賽中取得的成績(jī);四是主場(chǎng)優(yōu)勢(shì) 。
該模型通過10000次蒙特卡羅模擬(Monte Carlo simulations)校準(zhǔn)來確定球隊(duì)的獲勝概率和最后五場(chǎng)比賽的結(jié)果 。
2018年6月8日 , 多特蒙德技術(shù)大學(xué)(德國(guó))、根特大學(xué)(比利時(shí))和慕尼黑工業(yè)大學(xué)(德國(guó))的四名研究人員(A. Groll et al.等)在arXiv上發(fā)布了一篇關(guān)于2018年世界杯結(jié)果預(yù)測(cè)的研究論文 。 他們使用是著名的人工智能算法:隨機(jī)森林(Random Forest)和泊松排名算法(Poisson ranking algorithm) 。 6月14日 , 在俄羅斯與沙特阿拉伯舉行的世界杯揭幕戰(zhàn)之前 , 這篇文章被發(fā)表在網(wǎng)上 。 他們使用了一個(gè)數(shù)據(jù)集 , 該數(shù)據(jù)集能夠涵蓋過去四屆世界杯(2002-2014)的所有比賽 。 他們預(yù)測(cè)西班牙將成為冠軍 , 緊隨其后的是德國(guó)和巴西 。 以上三項(xiàng)研究都提及了西班牙、德國(guó)和巴西三個(gè)頂級(jí)團(tuán)隊(duì) , 只是順序不同 。 他們使用了三種不同的方法、數(shù)據(jù)和數(shù)據(jù)特性 , 但預(yù)測(cè)結(jié)果幾乎是一樣的 。 現(xiàn)在 , 世界杯已經(jīng)結(jié)束了 , 我們可以看到 , 所有這些模型都未能正確預(yù)測(cè)世界杯的結(jié)果 , 也沒有任何預(yù)測(cè)真正發(fā)生 。
在這些研究中 , A. Groll et al等人的研究方法是我在這一領(lǐng)域的最愛 。 首先 , 他們使用了一個(gè)好的數(shù)據(jù)源;其次 , 他們考慮了許多訓(xùn)練的特點(diǎn)和參數(shù) 。 第三 , 他們采用了隨機(jī)森林的算法 。 在本文的其余部分中 , 我將討論其數(shù)據(jù)特性、錯(cuò)誤以及在該領(lǐng)域失敗的原因 。
數(shù)據(jù)特性
A.Groll et al.等人考慮了與團(tuán)隊(duì)本身相關(guān)的各種特征 , 例如:經(jīng)濟(jì)因素(人均GDP、人口);體育因素(ODDSET概率 , 國(guó)際足聯(lián)排名);主場(chǎng)優(yōu)勢(shì)(東道主、洲、聯(lián)盟);球隊(duì)的結(jié)構(gòu)因素(每支球隊(duì)成員的最大數(shù)量、平均年齡、冠軍聯(lián)賽球員的數(shù)量);球隊(duì)的教練因素(年齡、任期、國(guó)籍) 。 總的來說 , 他們?yōu)槊總€(gè)隊(duì)和每屆世界杯總結(jié)了16個(gè)數(shù)據(jù)特性作為考慮因素 。
分類模型
正如我前面提到的 , 他們使用了“隨機(jī)森林(Random Forest)”的方法 , 這是人工智能和數(shù)據(jù)挖掘中眾所周知的算法之一 。 該算法以“決策樹(Decision Tree)”為基礎(chǔ) , 在許多案例中 , 決策樹在數(shù)據(jù)分類中表現(xiàn)出較高的性能 。 他們還使用泊松模型(Poisson models) , 根據(jù)球隊(duì)當(dāng)前的能力對(duì)團(tuán)隊(duì)進(jìn)行排名 。
預(yù)測(cè)
在完成了10萬次比賽的模擬后 , 預(yù)計(jì)西班牙將以28.9%的幾率成為冠軍 , 緊隨其后的是德國(guó)(26.3%)和巴西(21.9%) 。

推薦閱讀