データ分析

【PythonでFIFA21データ分析③】FIFA21のデータから将来有望な若手選手を発掘する!

2021年8月8日

【PythonでFIFAデータ分析③】FIFAのデータから将来有望な若手選手を発掘する!

こんにちは。TATです。

今回のテーマは「FIFA」です。

 

過去2回にわたって、Kaggleで発見したFIFA21のデータセットを分析してきました。

関連
【PythonでFIFA21データ分析①】FIFA21のデータから最強選手を探し出す!

続きを見る

関連
【PythonでFIFAデータ分析②】FIFAのデータから最強チームを導き出す!
【PythonでFIFA21データ分析②】FIFA21のデータから最強チームを導き出す!

続きを見る

 

今回はこれらの続きで最後のFIFAデータ分析になります。

最後の分析では、将来有望な若手選手を探してみようと思います。

FIFA21のデータセットには現状の総合能力値を示すOverallカラムと、将来的な可能性を示すPotentialカラムがあります。

このデータを使って、将来注目されそうな若手選手を探していきます。

 

【PythonでFIFAデータ分析③】FIFAのデータから将来有望な若手選手を発掘する!

【PythonでFIFAデータ分析③】FIFAのデータから将来有望な若手選手を発掘する!

(おさらい)データの確認

まずはデータを確認です。前の記事でもしているのでさっくりいきます。

利用するデータはKaggleのこちらのデータです。

FIFA21で利用できる選手やチームのデータがまとめられています。

FIFA 21 Players & Teams FULL Database / Summer UDP

 

ここには選手データとチームデータの2種類があります。

今回は選手データを使って分析を行なっていきます。

 

こちらが選手データです。

 

カラムも結構たくさんあって、細かいデータもまとめられています。

 

将来有望な若手選手を探す方法を考える

このデータを使って、どうしたらうまく将来有望な若手選手を探せるのかを考えていきます。

 

OverallとPotential

選手データを見ると、OverallPotentialというカラムがあります。

Overallは総合能力値を示すデータで、現時点の能力値を示します。

一方で、Potentialは名前の通り将来的な能力値を示しています。

 

トップ選手はすでに絶頂期の選手ばかりなので、Potentialに変化はあまりみられません。

伸び代があるのはやはり若手選手になります。

 

今回はOverallとPotentialカラムの差分(Potential - Overall)を計算して、「PotentialGap」というカラムを新たに作りました。

このPotentialGapが大きいほど、将来的な成長余地が大きいことを意味します。

 

PotentialGapをヒストグラムで示すとこのようになります。

 

0、つまり伸び代がもうない選手が大半を占めていますね。

一番高いものだとPotentialGapが26ありました。

 

何歳までが若手選手なのか?

次に若手選手について考えていきます。

何歳以下を若手選手にするかという問題です。

Overallカラムを年齢ごとにボックスプロットで描くと次のようになります。

このデータを見ると25歳までは右肩上がりで能力値が上昇していることがわかります。

25歳〜36歳くらいまでは横ばいで、それ以降は下落に転じます。

成長余地を考えると、若手選手と言えるのはマックスでも24歳かなと思います。

ここでは、24歳以下の選手を若手選手と定義することにします。

 

Potentialの基準値を決める

次にPotentialの基準値を決めます。

そもそもPotentialGapが大きくてもPotentialの数値は70とかだとそこまで有望とは言えません。

トップレベルまでレベルアップしうる選手こそが将来有望と言えます。

ということでここにも基準を設けることにします。

 

ここでは、上位1%の総合能力値を基準にします。

Overallをヒストグラムで示すと次のようになります。

 

このデータから上位1%の基準値を計算すると83になります。

つまり、Overallが83以上の選手は上位1%に入ることを意味します。

 

よって、Potentialの基準値もこれに合わせて将来的に83以上になる選手を探します。

 

基準値を参考に将来有望な若手選手を探し出す

それでは基準値が決まったところで、将来有望な若手選手を探していきます。

今回適用する基準は次の通りです。

  • Potentialが83以上(Overallの上位1%の基準値)
  • 年齢が24歳以下
  • Potential > Overall

 

この条件を満たす選手は全19,019選手中368選手まで絞られました。

ここから有望選手を探していきます。

 

成長余地が最も大きい若手選手

まずはシンプルに成長余地の大きな選手を探してみます。

基準を満たして、なおかつPotentialGapが大きい選手トップ10をご紹介します。

16歳と17歳の若手選手に絞られています。

そしてなんと第3位に日本人選手がランクインしています!

中井選手はレアル・マドリードの下部組織に所属している選手で、現在16歳です。

将来的には久保建英選手とレアル・マドリードのトップチームで活躍することが期待されています。

まさかの第3位に日本人選手が入っているとは嬉しいですね。

 

年齢ごとの有望若手選手

先ほどの結果を見ると、16歳と17歳の選手しか出てきませんでした。

若手=24歳以下という定義を作ったにも関わらず、出てきた結果は16歳と17歳だけという偏った結果になっているので、ここからは年齢別で見ていきます。

16歳〜24歳までで、PotentialGapが大きい選手トップ3をまとめてみました。

()内は所属チームを書きました。

年齢1位2位3位
16D. Scarlett(Tottenham Hotspur)S. Shoretire(Manchester United)T. Nakai(Real Madrid)
17B. Arrey-Mbi(Bayern München II)H. Mejbri(Manchester United)E. Anderson(Newcastle United)
18R. Drăgușin(Juventus)F. Orozco(Club Atlético Lanús)M. Taabouni(AZ Alkmaar)
19Gonçalo Ramos(SL Benfica)E. Ampadu(Sheffield United)N. Williams(Liverpool)
20Fábio Vieira(FC Porto)Abel Ruiz(SC Braga)F. Kadioglu(Fenerbahçe SK)
21Daniel Bragança(Sporting CP)N. Bustos(Girona FC)D. Popov(Dynamo Kyiv)
22Pedro Díaz(Real Sporting de Gijón)Óscar(Sevilla FC)B. White(Brighton & Hove Albion)
23A. Meret(Napoli)Luiz Felipe(Lazio)R. Koch(Leeds United)
24Palhinha(Sporting CP)N. Süle(FC Bayern München)L. Klostermann(RB Leipzig)

 

結果を見ても、知ってる選手は僕的には正直なところ中井選手しかいませんでした。。。

個人的には久保建英選手がランクインしてくることを期待していたのですが、見たところ同率10位でした。

ただPotentialが88はすごいですね。

 

これからの成長に期待です。

個人的には中井選手と久保選手が揃ってレアル・マドリードの先発メンバーに入るところを見たいです!

 

日本人選手のデータを見る

次に日本人選手のデータを見てみます。

24歳以下で、PotentialGapが0より大きい選手をリストアップしてみます。

 

Potentialの高い順に並べると次の通りになりました。

上位10人を表示しています。

 

1位は堂々の久保選手です。

2位はボローニャで活躍している富安選手です。

イタリアでバリバリ活躍している印象ですがまだ21歳なんですね。

これからが非常に楽しみな選手であります。

 

3位は先ほども登場した中井選手です。やはり16歳はぶち抜いて若いですね。

4位と5位はそれぞれ堂安選手と鎌田選手がランクインしました。

バルセロナ所属の安部選手も6位にランクインしています。

そしてここにランクインしている選手は海外に所属している選手が多いですね。

 

これからのますますの活躍を祈って全力で応援していきます!

 

(おまけ)レアル・マドリードの若手選手をチェックする

最後におまけとして久保選手と中井選手が所属しているレアル・マドリードの若手選手を見ていきます。

24歳以下の選手でPotentialGapが0より大きい選手をリストアップしました。

PotentialGapでみると、中井選手がトップです。

16歳で最年少なので期待大ですね。

 

久保選手と同じ19歳であるビニシウス選手とロドリゲス選手は久保選手の強大なライバルになりますね。

特にビニシウス選手はPotentialで久保選手を上回る90となっています。

久保選手や中井選手が将来的にトップチームでレギュラーを獲得するには、こうした強力なライバルたちに勝るパフォーマンスを出していかなければいけません。

決して簡単なことではありませんが、彼らなら成し遂げてくれると信じて応援していきましょう!

 

まとめ

いかがでしたでしょうか。

ここではKaggleで発見したFIFA21のデータセットを使って、将来有望な若手選手を探し出してみました。

日本人選手がランクインしていて嬉しい限りの結果となりました。

これからの活躍に期待ですね。

 

本記事を含めて3回にわたってFIFA21のデータセットを分析してきましたが、今回が最後の分析になります。

ここまで読んでくださりありがとうございました。

関連
【PythonでFIFA21データ分析①】FIFA21のデータから最強選手を探し出す!

続きを見る

関連
【PythonでFIFAデータ分析②】FIFAのデータから最強チームを導き出す!
【PythonでFIFA21データ分析②】FIFA21のデータから最強チームを導き出す!

続きを見る

Pythonおすすめ学習法

Udemy

Udemyの特徴

  • 高品質の動画教材がリーズナブルに購入できる
  • セール中なら定価の90%オフなどの価格破壊が起こる
  • 講師に直接掲示板から質問ができ、疑問を解消しながらスムーズに学習できる
  • 動画はダウンロード可能で、隙間時間に効率的に学習できる
  •  30日間の返金保証、一度購入すれば視聴期限なく受講可能

\30日返金保証/

Udemy 公式サイトへ

セール中なら90%オフとかで購入可能です!

キカガク

キカガクの特徴

  • Pythonだけでなく、数学の基礎から、環境構築、AIアプリケーション開発まで一気通貫で学べる
  • 自走できるAI・DX人材を育成
  • オンデマンドの講義 + プロの講師に質問し放題、定期的なメンタリング付き
  • 今後増える動画コンテンツを含め、全ての動画コンテンツが一生見放題
  • 専門実践教育訓練給付金制度を利用すると最大で受講料の70%が還元される

\Pythonだけでなく、機械学習やAIの基礎から学べる/

キカガクを詳しく見る

企業の研修材料にも採用される実績と信頼のあるスクールです!

データミックス

データミックスの特徴

  • データサイエンティストが開発・監修した体系的かつ実践的に学べるカリキュラム
  • 「スキル」のみでなく、データサイエンスの本質である「理論」や「思考」が学べる
  • エンジニアに限らず、多様なキャリアを形成・構築できる
  • オンラインチャットツールによる質問対応やコミュニティなどの充実したフォロー体制
  • 専門実践教育訓練給付金の対象講座で授業料の最大70%還付

\データサイエンスとビジネスが学べる/

データミックス(datamix)を詳しく見る!

エンジニア転職だけでなく起業やフリーランスなど多様なキャリア形成・構築に繋がる

-データ分析
-, ,

© 2022 気ままなブログ