Jupyter NotebookでKaggleデータセットをダウンロードする方法


  1. Kaggle APIのインストール: Kaggle APIを使用するには、まずKaggle APIクライアントをインストールする必要があります。以下のコマンドを実行してインストールします。

    !pip install kaggle
  2. Kaggle APIの設定: Kaggle APIを使用するには、APIキーを取得して設定する必要があります。Kaggleのウェブサイトでアカウントを作成し、APIキーを生成します。生成されたAPIキーは、~/.kaggle/kaggle.jsonというファイルに保存します。

  3. データセットのダウンロード: Jupyter Notebook上でKaggleのデータセットをダウンロードするためには、以下の手順を実行します。

    • Kaggleのウェブサイトで、ダウンロードしたいデータセットのページに移動します。
    • データセットのページで、「Copy API Command」ボタンをクリックします。これにより、データセットをダウンロードするためのコマンドがクリップボードにコピーされます。
    • Jupyter Notebookのセルに移動し、以下のようにコマンドを実行します。

      !kaggle datasets download -d データセットの名前

      ここで、「データセットの名前」は実際のデータセットの名前に置き換えます。

  4. ダウンロードしたファイルの解凍: ダウンロードしたデータセットは、圧縮された形式(一般的にはZIPファイル)で保存されます。解凍するには、以下のコマンドを実行します。

    !unzip ダウンロードしたファイル名.zip

    ここで、「ダウンロードしたファイル名.zip」は実際のファイル名に置き換えます。

これらの手順を実行することで、Jupyter Notebook上でKaggleのデータセットをダウンロードし、解凍することができます。これにより、データセットを使用して分析やモデルのトレーニングを行うことができます。上記の手順はKaggle APIを使用する方法ですが、Kaggleのウェブサイトからデータセットを手動でダウンロードしてJupyter Notebookにアップロードする方法もあります。