こんにちは。TATです。
今日のテーマは「FIFA」です。
KaggleでFIFA21のデータセットを見つけたので分析してみました。
今回は、第1弾ということでFIFAデータから色々な角度から最強選手を探し出すことを目的にデータを弄っていきます。
チームや国、ポジションなど、様々な角度から最強選手を探してみることにします。
色々データを見てると結構面白かったので複数回に分けて記事を書いていきます。(1記事にまとめると超絶長くなることは明白なのでw)
目次
【PythonでFIFAデータ分析①】FIFAデータから最強選手を探し出す!
まずはデータを把握する
まずは分析対象となるデータを確認します。
データはKaggleから
今回データをいただいたのはKaggleのこちらのデータです。
FIFA21で利用できる選手やチームのデータがまとめられています。
→ FIFA 21 Players & Teams FULL Database / Summer UDP
FIFAは世界的に人気のサッカーゲームです。
僕も好きで一時期はかなりハマっていました。
Kaggleはデータ分析などのコンペティションを運営しているサイトです。
勝者には賞金が出たり主催会社の面接権利などをゲットすることができます。
他の参加者の分析結果をコード付きで見れるので、勉強の場としても最適な場所です。
ちなみにデータをダウンロードするには会員登録が必要になるのでご注意ください。
データの中身を確認
ダウンロードしたデータを確認すると2つのCSVがあります。
選手データとチームデータです。
選手データには、各選手の名前や所属クラブ、能力値などのデータがあります。
Overallが総合的な能力値に該当しますが、すでにこれが高い順にソートされています。
1位はアルゼンチンのメッシ選手ですね。
データはすでに綺麗に整形されている状態なので、データ整形の必要はありません。
このまますぐに分析に利用することができます。
もう1つのチームデータも同様に、各チームのデータがまとまっています。
こちらもデータ整形なしでそのまま使える感じでした。
こちらは名前順にソートされているようです。
カラムの確認
次に各データのカラムを確認していきましょう。
たくさんカラムがあるので、全て表示することができません。
よってカラムだけ表示して確認してみます。
ちょっとごちゃごちゃしていますが、色々なデータがありますね。
総合的な能力値を示すOverallはもちろんですが、さらに細かくShootingTotal(シュート)やDribblingTotal(ドリブル)などのデータもあります。
各能力値ごとの最強選手を探すのも楽しそうです。
さらにBestPositionというカラムのデータを使えば、各ポジションにおける最強選手もあぶりだせそうです。
次にチームのデータを見てみます。
選手のデータに比べてかなり少ないですね。
移籍金とか平均年齢、加入時の平均年齢といったデータまでありますね。
これは分析のしがいがありそうです。
ただ、ここではあくまで様々な最強選手を見つけることが目的なので、選手データだけを使っていきます。
それでは早速データを詳しくみていきましょう。
能力値ごとの最強選手
まずは何と言っても最強選手を知りたいですよね。
最初はシンプルに能力値ごとの最強選手を見ていきましょう。
ここで利用するのは総合能力値を示すOverall、および各能力値を示すPaceTotal, ShootingTotal, PassingTotal, DribblingTotal, DefendingTotal, PhysicalityTotalです。
順番に見ていきましょう。
参考のために、それぞれトップ10を発表していきます。
総合能力値で最強の選手は?
まずは総合能力値で最強の選手から見ていきます。
カラムが多すぎるのでだいぶ絞りました。
1位はみなさんご存知のメッシ選手、2位がクリスティアーノ・ロナウド選手、3位がレバンドフスキ選手です。
みなさん30歳オーバーでこのパフォーマンスを維持してるのは凄すぎます。
そして年齢で見るとエムバペ選手の若さが凄まじいですね。
まだ21歳です。これからが楽しみすぎます。
また、全体で見ると前線の選手が多い印象ですね。
これは能力値が高い選手は前線ポジションをする傾向にあるのか、あるいは能力値を数値化する際に得点を決めてる選手を高く評価しがちなのか(いわゆる人間のバイアス)なのか、気になるところです。
各能力値で最強の選手は?
次に各能力値ごとの最強選手を見てみましょう。
ここは結果も多いのでザザーっといきます。
PaceTotal(スピード)
ShootingTotal(シュート)
PassingTotal(パス)
DribblingTotal(ドリブル)
DefendingTotal(ディフェンス)
PhysicalityTotal(フィジカル)
いかがでしたでしょうか。お気に入りの選手はいましたか?
やはり能力値によってポジションに偏りがあるのは面白いところです。
ポジションによって必要とされる能力が変わってくることがデータから見てもよくわかります。
そして若い選手は結構知らない選手が多くて少しばかりショックを受けました・・・
ポジションごとの最強選手
次にポジションごとの最強選手を見ていきます。
これはBestPositionカラムを参考にしていきます。
それぞれベスト3を見ていきます。
テーブルにまとめました。()内は総合能力値を示しています。
ポジション | 1位 | 2位 | 3位 |
---|---|---|---|
CF | K. Benzema(89) | Roberto Firmino(85) | D. Mertens(85) |
ST | R. Lewandowski(92) | Cristiano Ronaldo(92) | K. Mbappé(90) |
RW | L. Messi(93) | M. Salah(90) | A. Di María(87) |
LW | Neymar Jr(91) | S. Mané(88) | R. Sterling(87) |
CAM | Bruno Fernandes(88) | P. Dybala(87) | T. Müller(87) |
CM | K. De Bruyne(91) | T. Kroos(88) | L. Modrić(87) |
RM | S. Gnabry(86) | João Cancelo(85) | L. Sané(85) |
LM | H. Son(89) | Bernardo Silva(86) | F. Kostić(84) |
CDM | Casemiro(89) | J. Kimmich(89) | N. Kanté(88) |
RWB | A. Wan-Bissaka(83) | Mário Fernandes(82) | Nélson Semedo(81) |
LWB | F. Mendy(83) | Gayà(83) | Angeliño(83) |
CB | V. van Dijk(90) | Sergio Ramos(89) | K. Koulibaly(88) |
RB | T. Alexander-Arnold(86) | Carvajal(86) | Ricardo Pereira(85) |
LB | A. Robertson(87) | Jordi Alba(86) | Alex Sandro(84) |
GK | J. Oblak(91) | M. ter Stegen(90) | M. Neuer(90) |
最強ベストイレブンを選出するならここから選ぶと良さそうです。
ポジションごとの総合能力値をボックスプロットにするとこのような結果になりました。
CFはずば抜けていることがわかりますね。
さらに上記の選手たちの国籍や所属チームを集計するとこのようになりました。
国籍で見るとドイツが最強です。
クラブではレアル・マドリードが1位でした。
年齢ごとの最強選手
次に年齢別の最強選手を見ていきます。
各年齢ごとの最強選手トップ3をまとめます。
()内は総合能力値です。
年齢 | 1位 | 2位 | 3位 |
---|---|---|---|
16 | R. Cherki(71) | A. Karabec(70) | L. Gourna(65) |
17 | E. Camavinga(78) | Pedri(77) | Ansu Fati(76) |
18 | B. Saka(79) | M. Greenwood(78) | Nuno Mendes(77) |
19 | E. Haaland(87) | A. Davies(81) | Vinícius Jr.(80) |
20 | J. Sancho(87) | M. de Ligt(85) | João Félix(83) |
21 | K. Mbappé(90) | T. Alexander-Arnold(86) | G. Donnarumma(86) |
22 | M. Rashford(85) | L. Martínez(84) | A. Wan-Bissaka(83) |
23 | F. de Jong(86) | Rúben Dias(85) | Arthur(84) |
24 | Rodri(86) | S. Gnabry(86) | K. Coman(86) |
25 | J. Kimmich(89) | Bruno Fernandes(88) | L. Goretzka(87) |
26 | H. Kane(89) | Ederson(88) | Marquinhos(87) |
27 | J. Oblak(91) | Alisson(89) | H. Son(89) |
28 | Neymar Jr(91) | V. van Dijk(90) | M. Salah(90) |
29 | K. De Bruyne(91) | N. Kanté(88) | K. Koulibaly(88) |
30 | T. Kroos(88) | W. Szczęsny(87) | T. Müller(87) |
31 | R. Lewandowski(92) | M. Hummels(87) | Jordi Alba(86) |
32 | K. Benzema(89) | A. Di María(87) | S. Agüero(87) |
33 | L. Messi(93) | K. Navas(89) | H. Lloris(87) |
34 | M. Neuer(90) | Sergio Ramos(89) | L. Modrić(87) |
35 | Cristiano Ronaldo(92) | S. Handanovič(87) | G. Chiellini(86) |
36 | Iniesta(80) | José Fonte(80) | J. Frendado(80) |
37 | F. Ribéry(81) | Pepe(81) | Pepe Reina(80) |
38 | Z. Ibrahimović(84) | Joaquín(80) | Jorge Molina(78) |
39 | A. D'Alessandro(75) | J. Corona(75) | J. Sand(75) |
40 | S. Torrico(72) | Nino(70) | A. Boruc(70) |
41 | D. Vaca(65) | J. Gillet(64) | D. Bulman(59) |
42 | G. Buffon(82) | Hilton(75) | C. Lucchetti(71) |
53 | K. Miura(59) |
なんとここで53歳という現役最年長選手である我らがキングカズこと三浦知良選手が入っていました。
最年長ゆえ、ランキングはキングカズ1人だけです。嬉しいですね!
そして42歳でも総合能力値82をキープするブッフォン選手は凄すぎます。
ついでに年齢別の総合能力値をボックスプロットしてみました。
25歳くらいまでは能力がどんどん上昇して、25〜36際あたりは横ばい、37歳から一気に下がっていきます。
現役選手として活躍し続けられるのは長くても36歳くらいまでになるのでしょうか。
25歳あたりからが一番脂も乗って活躍できる時期に突入する感じですね。
まとめ
いかがでしたでしょうか。
ここではKaggleで見つけたFIFA21のデータセットを使って、色々な最強選手を探してみました。
各能力値やポジションごとの最強選手のデータを使えば、最強のベストイレブンを構成する際のヒントになるのではないでしょうか。
もしFIFA21プレーヤーがこの記事を読んでくだされば、チーム作りの参考にしていただけると嬉しいです。
次回以降も引き続きFIFA21のデータ分析を続けていこうと思います。
全部を1記事にまとめると長くなりすぎるので複数回に分けて記事を書こうと思います。
第一弾はこれでおしまいです。
ここまで読んでくださりありがとうございました。