【小学生でも分かるKaggle入門】アカウント作成から、タイタニックのコンペで予測データを提出するまで

Kaggle

Kaggleをはじめてみたいけど、全部英語だし正直とっつきにくい辛いな…。全くの初心者向けに日本語で丁寧に分かりやすく解説してくれる記事はないかな?」

そんな風に困っている人の疑問に答えるため、懇切丁寧に解説していきます。

正直、Kaggleの初歩中の初歩をここまで丁寧に解説しているホームページは他にないと思います。

はじめてのKaggleに挑む前に

筆者がKaggleのことを知ったのは、2021年に入ってすぐ、機械学習エンジニアになりたい人のための本を読んだのがきっかけでした。

当時、まだAIについて情報を集め始めたばかりで、

Kaggleってカッコいいな。コンペに参加できたら楽しそうだな。

と、ぼんやり考えていたことを覚えています。

それからしばらくして、Kaggleのホームページを覗いてみたのですが、英語のメニューがずらっと並んでいるのに圧倒されたため、そのまま静かにページを閉じることになりました…

今でこそ、CourseraのMachine Learningの受講も終え、以前よりは自信をもってKaggleを始めることができましたが、完全初心者でも(小学生ですらも)Kaggleを始められるように、記事を書いていきたいと思います。よろしくお願いします!

Kaggleのアカウント作成

Kaggleのホームページにアクセス

まず、Kaggleのホームページにアクセスしましょう。

Kaggle
https://www.kaggle.com/

Kaggleのアカウント作成

Googleのアカウントを持っていれば、REGISTER WITH GOOGLEをクリックして、Kaggleのアカウントを登録します。

emailで登録する場合は、Register with Eailをクリックします。

すると、下記のような入力フォームが出てきますので、順番に埋めていきます。

Kaggleの利用規約に同意します。

登録したemail宛に認証コードが届くので、確認して入力します。

無事、Kaggleのカウント作成が終わりました!

アカウント作成、お疲れさまでした!次は、いよいよコンペへの参加方法です!

Kaggleでタイタニックのコンペに参加

Kaggleでは、始めたばかりの初心者向けにタイタニックのコンペというチュートリアルが用意されています。

このコンペをひとことで説明すると、年齢や性別などの乗客の情報から、乗客が亡くなったか生き残ったかを予測して、その正答率を競うというものです。

では早速、タイタニックのコンペに参加するため、ホームページ左にあるメニューからCompetitionsをクリックしましょう。

一番上にTitanicのコンペが表示されるので、クリックします。

Join Competitionをクリックすれば、いよいよタイタニックのコンペに参加することができます!

ルール確認のポップアップが出てきますので、I understand and Acceptをクリックします。

タイタニックのコンペに参加できましたね。次が最後ですので、もう少しだけがんばってください。

Kaggleでタイタニックのコンペに予測データを提出

サンプルの予測データのダウンロード

タイタニックのコンペには、サンプルの予測データが用意されています。

Dataタブをクリックしてみましょう。

下の方にスクロールしていくと、gender_submission.csvというファイルが出てきますので、右のダウンロードボタンをクリックします。

このファイルが今回の課題のサンプルの予測データです。

サンプルの予測データの提出

gender_submission.csvのダウンロードが完了したら、さっそく提出してみましょう。

画面右にあるSubmit Predictionsをクリックします。

画面中ほどに、アップロードフォームがありますので、先ほどダウンロードしたgender_submission.csvをドラッグアンドドロップします。

しばらくして、青いバーが右端まで行ったら、アップロードは完了です。

いよいよ、予測データの提出です。Make Submissionボタンをクリックしましょう!

おめでとうございます!無事、予測データの提出が終わりました。これであなたもKaggleデビューです!

画面上も緑のバーが表示され、Completeの文字が表示されています。

予測データの精度の確認

最後に、提出した予測データの精度を確認してみましょう。

メニューからMy Submissionsをクリックします。

右側にScoreが表示されていることが分かると思います。今回のスコアは0.76555となっていますので、76%の精度で予測が当たっているということが分かりました。

この記事では、Kaggleのアカウント作成から予測データの提出まで、ひとつひとつ丁寧に解説してみました。何事も最初の一歩を踏み出すのは大変なものですが、この記事をきっかけに、少しでも多くの人がKaggleの世界に足を踏み出すきっかけになれば幸いです。

以上、最後までお読みいただきありがとうございました。

コメント

タイトルとURLをコピーしました