Python データ分析 プログラミング学習

【経験談】Kaggleは意味ないと言われるけど?→ データ分析を勉強するには最適な環境です

2022年7月27日

Kaggleは意味ないのか?→ データ分析を勉強するには最適な環境です

こんにちは。TATです。

今日のテーマは「Kaggleは意味ないのか?→ データ分析を勉強するには最適な環境です」です。

 

Kaggleでググると、「Kaggle 意味ない」といったネガティブな候補が出てきます。

「実際のところはどうなのか?」というのを僕の経験を踏まえて本記事でお伝えできればと思います。

 

本記事を書いている2022年7月時点のプロフィールはざっくりとこんな感じです。

実務ではそれなりにデータ分析関連の仕事を経験していると思うので、そこそこ信憑性のある意見が提供できるのではないかと思っています。

TAT

TATのプロフィール

  • 社会人になってからPythonを独学して転職に成功
  • 本記事を執筆している2022年7月現在では、IT→金融→不動産テック→アドテク(現職)の業界を渡り歩く
  • ↑いずれも外資系企業です
  • データアナリスト(データ分析、可視化、お客さんへの提案など)やソフトウェアエンジニア(プロセス自動化、AI開発、スクレイピングなど)の業務に従事
  • 現職では外資系のアドテク会社で、デジタル広告のデータ分析を行ってお客さんにインサイトを提案したり、新たなデータの可視化方法や分析手法を考えてグローバルチームに発表したりしてます(英語で絶望中)

 

結論、Kaggleはデータ分析を学ぶにはとてもいい環境であると思っています。

いろいろなデータが手に入りますし、人のコードが見られるというのも学びが大きいです。

興味のあるデータを見つけて自分で分析してみるといろんな知見が得られます。

ただ、Kaggleでやることと実務では少し乖離が出てくることがあるのも事実なので、その辺りも含めてお話しできればと思います。

 

【経験談】Kaggleは意味ないと言われるけど?→ データ分析を勉強するには最適な環境です

Kaggleは意味ないのか?→ データ分析を勉強するには最適な環境です

Kaggleとは?

まずはKaggleについて簡単にご紹介しておきます。

冒頭でいきなり出してしまいましたが、Kaggleはデータ分析のコンペを運営しているサイトです。

Kaggle公式サイトより

 

いろいろなデータが与えられて、参加者が分析して結果を競い合います。

優勝者には、賞金が贈られたり、開催企業の就職面接を受ける権利などが与えられます。

GoogleやFacebook、日本企業ではメルカリなどもKaggleによるコンペを企画しています。

 

Kaggleで色々と実績を積んでおくとさまざまなチャンスを得られる可能性があります。

 

Kaggleは意味ないのか?

Kaggleは意味ないのか?

ここから本記事のメインテーマに踏み込んでいきます。

Googleで「Kaggle」と入力すると、検索候補に「Kaggle 意味ない」というかなりネガティブな候補が出てきます。

 

これからKaggleをやってみようという方には少し刺激が強いかもしれません。

なぜKaggleは意味ないと言われるのか、その理由について僕の考えをシェアできればと思います。

 

Kaggleと実際の業務には乖離がある、、、場合がある

Kaggleが意味ないと言われる理由の1つが、Kaggleと実際の業務は違うというものです。

いくらKaggleでいい成績を残すことができても実務では役に立たない」という意見が散見されます。

 

僕の経験上、この意見は半分あってると言えます。

ただ、全く役に立たないのか、と言われると「そんなことは決してない」と思っています。

 

実務ではKaggleのようにデータが用意されていることはあまりない

特にKaggleと実務で大きく異なることが多いと感じるのがデータの準備です。

 

Kaggleではあらかじめデータがある程度きれいな状態で用意されています。

CSV形式とかにまとめてくれている場合がほとんどです。

 

実際の業務ですと、こういったデータの準備から自分でしないといけないケースが結構あります。

SQLを書いてデータベースからデータを引っ張り出してきたり、スクレイピングで必要な情報を収集したり、政府とかの資料をダウンロードしてきたり、いろいろなケースがあります。

そもそも「どんなデータが必要なのか?」というところから自分で考えないといけない場合もあります。

 

僕の経験上、最初からデータが揃ってることなんてほぼなくて、「どんなデータが必要なのか」というところから自分で考えて用意することがほとんどです。

さらにデータを集めた後のデータ整形も重要です。

特にスクレイピングで収集したようなデータはそのまま分析に使えるケースはあまりなく、データの型変換とか分析用のカラムの作成とか色々な準備が必要になってきます。

 

Kaggleで用意されたデータの分析だけに慣れていると、いざ実務でデビューするとこのギャップにテンパってしまう方も少なからずいると思います。。。

 

実務では分析の目的から自分で考えないといけない場合も結構ある

そしてもう一つ、実務では分析の目的とかゴールがそもそも定まっていないケースも結構あります。

 

何のために分析を行うのか、最終的に何を達成したいのか、こういった点が不明瞭なまま仕事が降ってくることは結構あります。

「なんか面白いデータない?」ってのが最たる例ですw

 

中にはきちんと目的とか課題とかを明確にしたうえできちんと仕事を振ってくれる素敵な上司もいますが、僕の経験上、ぶっちゃけこういう人は少数派と思いますw

従って、この目的とかゴールの設定から自分でやらないといけないパターンも結構あります。

 

Kaggleでは「予測モデルと作りなさい」とかきちんとしたゴールがありますが、実務では必ずしもそうとは限りません。

 

Kaggleで行う作業は実務の一部に過ぎない

Kaggleで行う作業は、実務のごく一部に過ぎません。

 

実際の業務では、次のような流れで仕事が進んでいくことが多いです。ただの一例です。

実務の流れ

  1. 日々の業務から課題や問題点の発見する
  2. 解決方法を検討する(この中でデータによる検証とかが出てくる)
  3. 仮説を作って、それを立証するために必要なデータを洗いだす
  4. データを準備する(SQLとかスクレイピングとか)
  5. データ分析をする
  6. 結果を検証する
  7. OKなら任務完了、ダメなら2か3の戻ってOKになるまで繰り返す

 

僕の経験ベースになりますが、上記のパターンは結構多いです。

ざっくり7つのプロセスがありますが、Kaggleでやるのはここでいうところの5と6がメインです。

 

Kaggleだけを極めて、いざ実務で5と6以外の作業が突然要求されると面食らうかもしれません。

 

Kaggleでは分析能力が身につけられる!やる意義は大いにある

ここまでの内容を見ると、「おい、Kaggle意味ないじゃないか」と思われるかもしれません。

結論、そんなことは全くありません。

 

Kaggleで身につけられる分析スキルはとても価値がありますし、重宝されます。

データ分析のスキルは容易に得られるものではありません。

Excelとかでは到底できないような分析とか可視化ができるとかなり役立ちます。

機械学習とかAI関連の知識があるとさらに重宝されます。

 

逆に、先ほどの5と6以外のものは後からでも十分に学ぶことはできます。

分析とかAIでPythonに慣れていれば、SQLとかスクレイピングなどのハードルはそこまで高くありません。

分析をしているとロジカルシンキングが自然と身についてくるので、課題の見つけ方とか、必要なデータを洗い出す作業とかについては、結構スムーズに身につけることができると思います。

 

実務では1人で仕事することはあまりないので、チームメンバーからいろいろ学んでいけば後からでも十分に追いつける、というのが僕の経験からお伝えできることです。

Kaggleで学んだことが意味ないなんてことは決してありません。

 

Kaggleはデータ分析を学ぶには最適な環境です

Kaggleはデータ分析を学ぶには最適な環境です

以上のように、意味ないと言われがちなKaggleですが、僕個人としては十分にやる価値があると考えます。

データ分析でPythonやAIに関する知識が身につくのが大きな強みですし、その過程で培われるロジカルシンキングなどのソフトスキルは実務では大いに役立ちます。

 

人のコードを見ると多くの学びが得られる

さらにKaggleを利用する大きなメリットがもう1つあります。

それが、他の参加者のコードを見ることができるという点です。

特に自分より経験豊富な人たちのコードを見ると、コードの書き方や分析手法で学ぶことができます。

良いものがあればパクればOKですw

 

ある程度の知識が身につけば、あとは人のコードを見ながら学ぶことはとても効率的です。

自分では思いつかないような分析手法とか、効率的なコードの書き方とか、学べるものがたくさんあります。

僕自身もKaggleでいろいろな人のコードを見ながら学んできました。

 

ただ、Kaggle は基本的に英語サイトなので、英語が読めないとしんどいです・・・

逆を言えばついでに英語も学べちゃいます!(謎にポジティブw)

【経験談あり】プログラミング学習者が英語を学ぶべき理由!【メリットばかりです】

続きを見る

 

データアナリスト、データサイエンティストに興味のある方にもおすすめ

Kaggleはデータ分析を学ぶには最適な場所です。

さらにデータアナリストやデータサイエンティストの仕事に興味のある方にもおすすめです。

 

いずれの職種においても分析スキルは必須になってくるので、Kaggleでこの経験をしておくと後から役立つこと間違いなしです。

データアナリストやデータサイエンティストの仕事は、会社によって求められる業務内容とか範囲が変わってくるケースが結構あります。

Kaggleでやってきたこと以外の作業が要求される場合もあると思いますが、Kaggleを通じて培った分析能力とかロジカルシンキングとか課題解決能力とかを駆使すれば追いつくことは可能であると思います。

 

データ分析をはじめ、データアナリストやデータサイエンティストの仕事に興味のある方は是非ともKaggleをトライしてみてください。

 

まとめ

本記事では、「Kaggleは意味ないのか?→ データ分析を勉強するには最適な環境です」というテーマでお話してきました。

 

Kaggleでググると、「Kaggle 意味ない」といったネガティブな検索候補がわりと上の方に出てきます。

Kaggleと実務では乖離がある場合があるので、Kaggleだけを極めるとすぐに実務でバリバリ活躍するのは結構難しいと思います。

 

ただ、全く意味ないかと言われるとそんなことは全くありません、というのが僕の考えです。

少なくともKaggleを通して身につけられる分析能力とかロジカルシンキングは実務でも大いに役立ちます。

 

特にロジカルシンキングみたいなソフトスキルはどんな仕事においても役立ちますし、新しいことを勉強するときも効率的に学ぶことができると思います。

Kaggleで実務に必要な全てを学べるとは思いませんが、データ分析スキルは確実に身につきます。

そしてこのスキルは実務では必ず必要になってくるので、Kaggleをやる意味は大いにあります。

 

足りない部分は後から勉強しても追いつくことは可能です。

データ分析に興味のある方、データアナリストやデータサイエンティストなどの死後に関心のある方は、是非ともKaggleでいろいろなデータに触れてみることをおすすめします。

 

ここまで読んでくださり、ありがとうございました。

Pythonおすすめ学習法

Udemy

Udemyの特徴

  • 高品質の動画教材がリーズナブルに購入できる
  • セール中なら定価の90%オフなどの価格破壊が起こる
  • 講師に直接掲示板から質問ができ、疑問を解消しながらスムーズに学習できる
  • 動画はダウンロード可能で、隙間時間に効率的に学習できる
  •  30日間の返金保証、一度購入すれば視聴期限なく受講可能

\30日返金保証/

Udemy 公式サイトへ

セール中なら90%オフとかで購入可能です!

キカガク

キカガクの特徴

  • Pythonだけでなく、数学の基礎から、環境構築、AIアプリケーション開発まで一気通貫で学べる
  • 自走できるAI・DX人材を育成
  • オンデマンドの講義 + プロの講師に質問し放題、定期的なメンタリング付き
  • 今後増える動画コンテンツを含め、全ての動画コンテンツが一生見放題
  • 専門実践教育訓練給付金制度を利用すると最大で受講料の70%が還元される

\Pythonだけでなく、機械学習やAIの基礎から学べる/

キカガクを詳しく見る

企業の研修材料にも採用される実績と信頼のあるスクールです!

データミックス

データミックスの特徴

  • データサイエンティストが開発・監修した体系的かつ実践的に学べるカリキュラム
  • 「スキル」のみでなく、データサイエンスの本質である「理論」や「思考」が学べる
  • エンジニアに限らず、多様なキャリアを形成・構築できる
  • オンラインチャットツールによる質問対応やコミュニティなどの充実したフォロー体制
  • 専門実践教育訓練給付金の対象講座で授業料の最大70%還付

\データサイエンスとビジネスが学べる/

データミックス(datamix)を詳しく見る!

エンジニア転職だけでなく起業やフリーランスなど多様なキャリア形成・構築に繋がる

-Python, データ分析, プログラミング学習
-, ,

© 2022 気ままなブログ