データ分析

【PythonでFIFA21データ分析①】FIFA21のデータから最強選手を探し出す!

2021年8月1日

こんにちは。TATです。

 

今日のテーマは「FIFA」です。

KaggleでFIFA21のデータセットを見つけたので分析してみました。

今回は、第1弾ということでFIFAデータから色々な角度から最強選手を探し出すことを目的にデータを弄っていきます。

チームや国、ポジションなど、様々な角度から最強選手を探してみることにします。

 

色々データを見てると結構面白かったので複数回に分けて記事を書いていきます。(1記事にまとめると超絶長くなることは明白なのでw)

 

【PythonでFIFAデータ分析①】FIFAデータから最強選手を探し出す!

まずはデータを把握する

まずは分析対象となるデータを確認します。

 

データはKaggleから

今回データをいただいたのはKaggleのこちらのデータです。

FIFA21で利用できる選手やチームのデータがまとめられています。

FIFA 21 Players & Teams FULL Database / Summer UDP

 

FIFAは世界的に人気のサッカーゲームです。

僕も好きで一時期はかなりハマっていました。

 

Kaggleはデータ分析などのコンペティションを運営しているサイトです。

勝者には賞金が出たり主催会社の面接権利などをゲットすることができます。

他の参加者の分析結果をコード付きで見れるので、勉強の場としても最適な場所です。

 

ちなみにデータをダウンロードするには会員登録が必要になるのでご注意ください。

 

データの中身を確認

ダウンロードしたデータを確認すると2つのCSVがあります。

選手データチームデータです。

選手データには、各選手の名前や所属クラブ、能力値などのデータがあります。

Overallが総合的な能力値に該当しますが、すでにこれが高い順にソートされています。

1位はアルゼンチンのメッシ選手ですね。

 

データはすでに綺麗に整形されている状態なので、データ整形の必要はありません。

このまますぐに分析に利用することができます。

 

もう1つのチームデータも同様に、各チームのデータがまとまっています。

こちらもデータ整形なしでそのまま使える感じでした。

こちらは名前順にソートされているようです。

 

カラムの確認

次に各データのカラムを確認していきましょう。

たくさんカラムがあるので、全て表示することができません。

よってカラムだけ表示して確認してみます。

ちょっとごちゃごちゃしていますが、色々なデータがありますね。

総合的な能力値を示すOverallはもちろんですが、さらに細かくShootingTotal(シュート)やDribblingTotal(ドリブル)などのデータもあります。

各能力値ごとの最強選手を探すのも楽しそうです。

さらにBestPositionというカラムのデータを使えば、各ポジションにおける最強選手もあぶりだせそうです。

 

次にチームのデータを見てみます。

選手のデータに比べてかなり少ないですね。

移籍金とか平均年齢、加入時の平均年齢といったデータまでありますね。

これは分析のしがいがありそうです。

 

ただ、ここではあくまで様々な最強選手を見つけることが目的なので、選手データだけを使っていきます。

それでは早速データを詳しくみていきましょう。

 

能力値ごとの最強選手

まずは何と言っても最強選手を知りたいですよね。

最初はシンプルに能力値ごとの最強選手を見ていきましょう。

ここで利用するのは総合能力値を示すOverall、および各能力値を示すPaceTotal, ShootingTotal, PassingTotal, DribblingTotal, DefendingTotal, PhysicalityTotalです。

順番に見ていきましょう。

参考のために、それぞれトップ10を発表していきます。

 

総合能力値で最強の選手は?

まずは総合能力値で最強の選手から見ていきます。

カラムが多すぎるのでだいぶ絞りました。

 

1位はみなさんご存知のメッシ選手、2位がクリスティアーノ・ロナウド選手、3位がレバンドフスキ選手です。

みなさん30歳オーバーでこのパフォーマンスを維持してるのは凄すぎます。

そして年齢で見るとエムバペ選手の若さが凄まじいですね。

まだ21歳です。これからが楽しみすぎます。

 

また、全体で見ると前線の選手が多い印象ですね。

これは能力値が高い選手は前線ポジションをする傾向にあるのか、あるいは能力値を数値化する際に得点を決めてる選手を高く評価しがちなのか(いわゆる人間のバイアス)なのか、気になるところです。

 

各能力値で最強の選手は?

次に各能力値ごとの最強選手を見てみましょう。

ここは結果も多いのでザザーっといきます。

 

PaceTotal(スピード)

 

ShootingTotal(シュート)

 

PassingTotal(パス)

 

DribblingTotal(ドリブル)

 

DefendingTotal(ディフェンス)

 

PhysicalityTotal(フィジカル)

 

いかがでしたでしょうか。お気に入りの選手はいましたか?

やはり能力値によってポジションに偏りがあるのは面白いところです。

ポジションによって必要とされる能力が変わってくることがデータから見てもよくわかります。

そして若い選手は結構知らない選手が多くて少しばかりショックを受けました・・・

 

ポジションごとの最強選手

次にポジションごとの最強選手を見ていきます。

これはBestPositionカラムを参考にしていきます。

それぞれベスト3を見ていきます。

テーブルにまとめました。()内は総合能力値を示しています。

ポジション1位2位3位
CFK. Benzema(89)Roberto Firmino(85)D. Mertens(85)
STR. Lewandowski(92)Cristiano Ronaldo(92)K. Mbappé(90)
RWL. Messi(93)M. Salah(90)A. Di María(87)
LWNeymar Jr(91)S. Mané(88)R. Sterling(87)
CAMBruno Fernandes(88)P. Dybala(87)T. Müller(87)
CMK. De Bruyne(91)T. Kroos(88)L. Modrić(87)
RMS. Gnabry(86)João Cancelo(85)L. Sané(85)
LMH. Son(89)Bernardo Silva(86)F. Kostić(84)
CDMCasemiro(89)J. Kimmich(89)N. Kanté(88)
RWBA. Wan-Bissaka(83)Mário Fernandes(82)Nélson Semedo(81)
LWBF. Mendy(83)Gayà(83)Angeliño(83)
CBV. van Dijk(90)Sergio Ramos(89)K. Koulibaly(88)
RBT. Alexander-Arnold(86)Carvajal(86)Ricardo Pereira(85)
LBA. Robertson(87)Jordi Alba(86)Alex Sandro(84)
GKJ. Oblak(91)M. ter Stegen(90)M. Neuer(90)

 

最強ベストイレブンを選出するならここから選ぶと良さそうです。

ポジションごとの総合能力値をボックスプロットにするとこのような結果になりました。

CFはずば抜けていることがわかりますね。

 

さらに上記の選手たちの国籍や所属チームを集計するとこのようになりました。

国籍で見るとドイツが最強です。

 

クラブではレアル・マドリードが1位でした。

 

年齢ごとの最強選手

次に年齢別の最強選手を見ていきます。

各年齢ごとの最強選手トップ3をまとめます。

()内は総合能力値です。

年齢1位2位3位
16R. Cherki(71)A. Karabec(70)L. Gourna(65)
17E. Camavinga(78)Pedri(77)Ansu Fati(76)
18B. Saka(79)M. Greenwood(78)Nuno Mendes(77)
19E. Haaland(87)A. Davies(81)Vinícius Jr.(80)
20J. Sancho(87)M. de Ligt(85)João Félix(83)
21K. Mbappé(90)T. Alexander-Arnold(86)G. Donnarumma(86)
22M. Rashford(85)L. Martínez(84)A. Wan-Bissaka(83)
23F. de Jong(86)Rúben Dias(85)Arthur(84)
24Rodri(86)S. Gnabry(86)K. Coman(86)
25J. Kimmich(89)Bruno Fernandes(88)L. Goretzka(87)
26H. Kane(89)Ederson(88)Marquinhos(87)
27J. Oblak(91)Alisson(89)H. Son(89)
28Neymar Jr(91)V. van Dijk(90)M. Salah(90)
29K. De Bruyne(91)N. Kanté(88)K. Koulibaly(88)
30T. Kroos(88)W. Szczęsny(87)T. Müller(87)
31R. Lewandowski(92)M. Hummels(87)Jordi Alba(86)
32K. Benzema(89)A. Di María(87)S. Agüero(87)
33L. Messi(93)K. Navas(89)H. Lloris(87)
34M. Neuer(90)Sergio Ramos(89)L. Modrić(87)
35Cristiano Ronaldo(92)S. Handanovič(87)G. Chiellini(86)
36Iniesta(80)José Fonte(80)J. Frendado(80)
37F. Ribéry(81)Pepe(81)Pepe Reina(80)
38Z. Ibrahimović(84)Joaquín(80)Jorge Molina(78)
39A. D'Alessandro(75)J. Corona(75)J. Sand(75)
40S. Torrico(72)Nino(70)A. Boruc(70)
41D. Vaca(65)J. Gillet(64)D. Bulman(59)
42G. Buffon(82)Hilton(75)C. Lucchetti(71)
53K. Miura(59)

 

なんとここで53歳という現役最年長選手である我らがキングカズこと三浦知良選手が入っていました。

最年長ゆえ、ランキングはキングカズ1人だけです。嬉しいですね!

そして42歳でも総合能力値82をキープするブッフォン選手は凄すぎます。

 

ついでに年齢別の総合能力値をボックスプロットしてみました。

25歳くらいまでは能力がどんどん上昇して、25〜36際あたりは横ばい、37歳から一気に下がっていきます。

現役選手として活躍し続けられるのは長くても36歳くらいまでになるのでしょうか。

25歳あたりからが一番脂も乗って活躍できる時期に突入する感じですね。

 

まとめ

いかがでしたでしょうか。

ここではKaggleで見つけたFIFA21のデータセットを使って、色々な最強選手を探してみました。

各能力値やポジションごとの最強選手のデータを使えば、最強のベストイレブンを構成する際のヒントになるのではないでしょうか。

もしFIFA21プレーヤーがこの記事を読んでくだされば、チーム作りの参考にしていただけると嬉しいです。

 

次回以降も引き続きFIFA21のデータ分析を続けていこうと思います。

全部を1記事にまとめると長くなりすぎるので複数回に分けて記事を書こうと思います。

第一弾はこれでおしまいです。

ここまで読んでくださりありがとうございました。


データ分析するならPythonがおすすめです!

データ分析に興味があるならPythonがおすすめです。

データの収集から整形、分析、可視化、さらに機械学習やAIの実装など、あらゆる用途に活用できます。

昨今のAIブームでPythonの需要は拡大しており、習得しておくと転職市場でも有利です。

【いますぐ始められます】データ分析をするならPythonが最適です。【学習方法もご紹介します!】

【人気上昇中】今人気のプログラミング言語「Python」は何ができるのか?できることまとめます【転職でも有利です】



おすすめのPython学習法!

独学ロードマップを作りました!

これからPythonを学びたい方、あるいは学び始めたばかりの方に向けて、独学ロードマップを作りました。

僕自身、Pythonは社会人になってから独学で習得したので、その経験を踏まえてまとめています。

Python習得までの道のりがステップバイステップでわかるようになっています。

【決定版】Python独学ロードマップ【完全初心者からでもOKです】


独学ならUdemyがおすすめ!

Pythonを独学するならUdemyがおすすめです。

動画教材なので、書籍などに比べて圧倒的にわかりやすいです。

セール中なら90%オフとかで購入可能で、30日の返金保証もついています。

僕は社会人になってからUdemyでPythonを独学して転職にも成功しました。

プログラミングの独学にUdemyをおすすめする理由!【僕はUdemyでPythonを独学しました!】

Udemyのセールはいつ行われるのか?期間は?対象コースは?

Udemyを見る


プログラミングスクールもあり

独学に自信がない方、独学で挫折した方は、プログラミングスクールも検討の余地があります。

いつでも講師に質問できる環境が整っていたり、オリジナルの教材が利用できたり、たくさんのメリットを享受することができます。

ただし、料金は安くないので、無料体験レッスンなどを受けたうえで判断するのがおすすめです。

【まとめ】Pythonが学べるおすすめプログラミングスクール


-データ分析
-, ,

© 2022 気ままなブログ