こんにちは。TATです。
今日のテーマは「Kaggleは意味ないのか?→ データ分析を勉強するには最適な環境です」です。
Kaggleでググると、「Kaggle 意味ない」といったネガティブな候補が出てきます。
「実際のところはどうなのか?」というのを僕の経験を踏まえて本記事でお伝えできればと思います。
本記事の信憑性
結論、Kaggleはデータ分析を学ぶにはとてもいい環境であると思っています。
いろいろなデータが手に入りますし、人のコードが見られるというのも学びが大きいです。
興味のあるデータを見つけて自分で分析してみるといろんな知見が得られます。
ただ、Kaggleでやることと実務では少し乖離が出てくることがあるのも事実なので、その辺りも含めてお話しできればと思います。
【経験談】Kaggleは意味ないと言われるけど?→ データ分析を勉強するには最適な環境です
Kaggleとは?
まずはKaggleについて簡単にご紹介しておきます。
冒頭でいきなり出してしまいましたが、Kaggleはデータ分析のコンペを運営しているサイトです。
Kaggle公式サイトより
いろいろなデータが与えられて、参加者が分析して結果を競い合います。
優勝者には、賞金が贈られたり、開催企業の就職面接を受ける権利などが与えられます。
GoogleやFacebook、日本企業ではメルカリなどもKaggleによるコンペを企画しています。
Kaggleで色々と実績を積んでおくとさまざまなチャンスを得られる可能性があります。
Kaggleは意味ないのか?
ここから本記事のメインテーマに踏み込んでいきます。
Googleで「Kaggle」と入力すると、検索候補に「Kaggle 意味ない」というかなりネガティブな候補が出てきます。
これからKaggleをやってみようという方には少し刺激が強いかもしれません。
なぜKaggleは意味ないと言われるのか、その理由について僕の考えをシェアできればと思います。
Kaggleと実際の業務には乖離がある、、、場合がある
Kaggleが意味ないと言われる理由の1つが、Kaggleと実際の業務は違うというものです。
「いくらKaggleでいい成績を残すことができても実務では役に立たない」という意見が散見されます。
僕の経験上、この意見は半分あってると言えます。
ただ、全く役に立たないのか、と言われると「そんなことは決してない」と思っています。
実務ではKaggleのようにデータが用意されていることはあまりない
特にKaggleと実務で大きく異なることが多いと感じるのがデータの準備です。
Kaggleではあらかじめデータがある程度きれいな状態で用意されています。
CSV形式とかにまとめてくれている場合がほとんどです。
実際の業務ですと、こういったデータの準備から自分でしないといけないケースが結構あります。
SQLを書いてデータベースからデータを引っ張り出してきたり、スクレイピングで必要な情報を収集したり、政府とかの資料をダウンロードしてきたり、いろいろなケースがあります。
そもそも「どんなデータが必要なのか?」というところから自分で考えないといけない場合もあります。
僕の経験上、最初からデータが揃ってることなんてほぼなくて、「どんなデータが必要なのか」というところから自分で考えて用意することがほとんどです。
さらにデータを集めた後のデータ整形も重要です。
特にスクレイピングで収集したようなデータはそのまま分析に使えるケースはあまりなく、データの型変換とか分析用のカラムの作成とか色々な準備が必要になってきます。
Kaggleで用意されたデータの分析だけに慣れていると、いざ実務でデビューするとこのギャップにテンパってしまう方も少なからずいると思います。。。
実務では分析の目的から自分で考えないといけない場合も結構ある
そしてもう一つ、実務では分析の目的とかゴールがそもそも定まっていないケースも結構あります。
何のために分析を行うのか、最終的に何を達成したいのか、こういった点が不明瞭なまま仕事が降ってくることは結構あります。
「なんか面白いデータない?」ってのが最たる例ですw
中にはきちんと目的とか課題とかを明確にしたうえできちんと仕事を振ってくれる素敵な上司もいますが、僕の経験上、ぶっちゃけこういう人は少数派と思いますw
従って、この目的とかゴールの設定から自分でやらないといけないパターンも結構あります。
Kaggleでは「予測モデルと作りなさい」とかきちんとしたゴールがありますが、実務では必ずしもそうとは限りません。
Kaggleで行う作業は実務の一部に過ぎない
Kaggleで行う作業は、実務のごく一部に過ぎません。
実際の業務では、次のような流れで仕事が進んでいくことが多いです。ただの一例です。
実務の流れ
- 日々の業務から課題や問題点の発見する
- 解決方法を検討する(この中でデータによる検証とかが出てくる)
- 仮説を作って、それを立証するために必要なデータを洗いだす
- データを準備する(SQLとかスクレイピングとか)
- データ分析をする
- 結果を検証する
- OKなら任務完了、ダメなら2か3の戻ってOKになるまで繰り返す
僕の経験ベースになりますが、上記のパターンは結構多いです。
ざっくり7つのプロセスがありますが、Kaggleでやるのはここでいうところの5と6がメインです。
Kaggleだけを極めて、いざ実務で5と6以外の作業が突然要求されると面食らうかもしれません。
Kaggleでは分析能力が身につけられる!やる意義は大いにある
ここまでの内容を見ると、「おい、Kaggle意味ないじゃないか」と思われるかもしれません。
結論、そんなことは全くありません。
Kaggleで身につけられる分析スキルはとても価値がありますし、重宝されます。
データ分析のスキルは容易に得られるものではありません。
Excelとかでは到底できないような分析とか可視化ができるとかなり役立ちます。
機械学習とかAI関連の知識があるとさらに重宝されます。
逆に、先ほどの5と6以外のものは後からでも十分に学ぶことはできます。
分析とかAIでPythonに慣れていれば、SQLとかスクレイピングなどのハードルはそこまで高くありません。
分析をしているとロジカルシンキングが自然と身についてくるので、課題の見つけ方とか、必要なデータを洗い出す作業とかについては、結構スムーズに身につけることができると思います。
実務では1人で仕事することはあまりないので、チームメンバーからいろいろ学んでいけば後からでも十分に追いつける、というのが僕の経験からお伝えできることです。
Kaggleで学んだことが意味ないなんてことは決してありません。
Kaggleはデータ分析を学ぶには最適な環境です
以上のように、意味ないと言われがちなKaggleですが、僕個人としては十分にやる価値があると考えます。
データ分析でPythonやAIに関する知識が身につくのが大きな強みですし、その過程で培われるロジカルシンキングなどのソフトスキルは実務では大いに役立ちます。
人のコードを見ると多くの学びが得られる
さらにKaggleを利用する大きなメリットがもう1つあります。
それが、他の参加者のコードを見ることができるという点です。
特に自分より経験豊富な人たちのコードを見ると、コードの書き方や分析手法で学ぶことができます。
良いものがあればパクればOKですw
ある程度の知識が身につけば、あとは人のコードを見ながら学ぶことはとても効率的です。
自分では思いつかないような分析手法とか、効率的なコードの書き方とか、学べるものがたくさんあります。
僕自身もKaggleでいろいろな人のコードを見ながら学んできました。
ただ、Kaggle は基本的に英語サイトなので、英語が読めないとしんどいです・・・
逆を言えばついでに英語も学べちゃいます!(謎にポジティブw)
【経験談あり】プログラミング学習者が英語を学ぶべき理由!【メリットばかりです】
続きを見る
データアナリスト、データサイエンティストに興味のある方にもおすすめ
Kaggleはデータ分析を学ぶには最適な場所です。
さらにデータアナリストやデータサイエンティストの仕事に興味のある方にもおすすめです。
いずれの職種においても分析スキルは必須になってくるので、Kaggleでこの経験をしておくと後から役立つこと間違いなしです。
データアナリストやデータサイエンティストの仕事は、会社によって求められる業務内容とか範囲が変わってくるケースが結構あります。
Kaggleでやってきたこと以外の作業が要求される場合もあると思いますが、Kaggleを通じて培った分析能力とかロジカルシンキングとか課題解決能力とかを駆使すれば追いつくことは可能であると思います。
データ分析をはじめ、データアナリストやデータサイエンティストの仕事に興味のある方は是非ともKaggleをトライしてみてください。
まとめ
本記事では、「Kaggleは意味ないのか?→ データ分析を勉強するには最適な環境です」というテーマでお話してきました。
Kaggleでググると、「Kaggle 意味ない」といったネガティブな検索候補がわりと上の方に出てきます。
Kaggleと実務では乖離がある場合があるので、Kaggleだけを極めるとすぐに実務でバリバリ活躍するのは結構難しいと思います。
ただ、全く意味ないかと言われるとそんなことは全くありません、というのが僕の考えです。
少なくともKaggleを通して身につけられる分析能力とかロジカルシンキングは実務でも大いに役立ちます。
特にロジカルシンキングみたいなソフトスキルはどんな仕事においても役立ちますし、新しいことを勉強するときも効率的に学ぶことができると思います。
Kaggleで実務に必要な全てを学べるとは思いませんが、データ分析スキルは確実に身につきます。
そしてこのスキルは実務では必ず必要になってくるので、Kaggleをやる意味は大いにあります。
足りない部分は後から勉強しても追いつくことは可能です。
データ分析に興味のある方、データアナリストやデータサイエンティストなどの死後に関心のある方は、是非ともKaggleでいろいろなデータに触れてみることをおすすめします。
ここまで読んでくださり、ありがとうございました。