deepblueインターン生の中山です。前回Colaboratoryを使ったword2vecについての記事を示したのですが、その関連記事になります。ちょっとしたtipsの様な内容です。
(注:2019年10月7日時点での記事になります。Colaboratoryが更新されて仕様が変わることもあるので、ご了承ください。)

対象の読者

  • Google Colaboratory 初心者
  • データを毎回ローカルからアップロードするのがめんどくさいと感じている方

前回まで

word2vecの記事では、ローカル環境からデータをあげて読み込んでいました。前回の記事では、本質的ではなかったため、説明を割愛してしまいました。本記事では、その内容についてご説明いたします。
ローカルからのアップロードをコードで書くと下記となります。

from google.colab import files
uploaded = files.upload()

以上より、ローカルからデータをアップロードすることができました.

この手順でも問題ないですが、毎回アップロードする作業はかなり手間です。Google Driveから落とすことで時間の削減ができます。その手順について下記に説明を致します。

Driveから落とす手順

データをDriveにアップロード

まず、Drive上の任意の場所にデータをアップロードします。今回は、Pythonのコードと同じディレクトリ内に設置します。

Driveをマウント

続いて、Driveのマウントを行います。Colaboiratory画面の左端に不等号>のようなマークがあります。そのボタンを押下します。

不等号マークを押下すると、左側に『ドライブをマウント』というボタンが出てくると思います。次にそれをクリックします。

すると、以下のような新たなセルができることが確認できます。

from google.colab import drive
drive.mount('/content/drive')

このコードを実行すると、このようなURLが登場すると思います。

そして、このURLをクリックします。すると、認証ページに飛びます。認証ページでauthorization codeが得られるので、下の枠内に張り付けます。

左側を確認すると『drive』ができていることがわかります。これで、マウントが完了となります。

データの読み込み

ドライブの画面内で、自分の欲しいデータがあるディレクトリまで移動します。データを見つけたら、右クリックからパスのコピーを選択します。

あとは、通常通りデータを読み込むだけです。データを読み込む際にコピーしたパスを利用します。

import pandas as pd
data = pd.read_csv('/content/drive/My Drive/nakayama/blog/iris.data', header=None)

まとめ

以上より、ColaboratoryのデータをDriveから読み込むことができます。毎回データを読み込むのが煩わしい方などは試してみてください。

(著:K Murase

関連記事