【まとめ】Google ColaboratoryでRを使う方法、RStanも実行可能

Google Colaboratory R Tips

統計処理に特化したプログラミング言語「R」の環境を、Google Colaboratory上で構築してみようというお話。

しかしどうやら、Google ColaboratoryでRが利用可能になっており、結構簡単な作業でRが利用できるようになります。

スポンサーリンク

Google Colaboratorとは

  • CPU:Intel(R) Xeon(R) CPU @ 2.30GHz
  • GPU:NVIDIA Tesla K80
  • RAM:13GB
  • 90分ルール:90分ノートブックのセッションが切れるとリセット
  • 12時間:新しいインスタンスを起動してから12時間

性能としては上の通り。

Google Colaboratory

Google ColaboratoryはJupyter Notebookをブラウザ上で実行できるもの。Googldドライブ内にあり、Googleドキュメントを実行するような感覚で、プログラミングを行えるのが魅力。時間制限はあるものの、Googleのサーバを利用し、CPUやGPUそれほど負担をかけず、環境構築の手間が不要で機械学習などを行えます。

基本的にはPythonがメインなのですが、なぜかRの環境も入っていて、Rのコードが実行できるので、そこで動かして見ようぜというお話。

Colabのカーネル確認

!jupyter kernelspec list

このコードをGoogle Colaboratoryに打ち込むと、現在存在するカーネルが確認できます。現時点で確認できるのはRとPython2, 3、Swiftとなっています。

使い方1:スクリプトだけ

%%script R --vanilla --quiet
x <- c(1:100)

スクリプトを打ち込んで使う方法があります。ただあくまでスクリプトなのでそのブロックでしか利用できないという問題点があります。

使い方2:ノートブックをRとして使う

  1. ノートブックのファイルをダウンロード
  2. ファイルを書き換え
  3. アップロードする

手順としては上記の通り。

ipynb
まず、Google Colaboratoryから拡張子が".ipynb"のファイルをダウンロード。Googleドライブ上で作成したファイルをダウンロードしてきます。

ipynb

"kernelspec": {
  "name": "ir",
  "display_name": "R"
}

ダウンロードしたファイルをテキストエディタで開き、"kernelspec"を上記の様に編集し、アップロードします。

後はそのファイルを開くだけで、Google ColaboratoryでRのランタイムが利用できます。

ファイルの読み込み・書き出し

Google Colab
ファイルの読み込みと書き出したファイルのダウンロードに関しては、左のファイルアップロードから行うことが可能。右クリックすると削除やダウンロードのメニューが出てきます。

base <- read.csv("/content/test.csv", header=T, )
write.csv(base, "/content/test1.csv", quote=F, col.names=F, append=T)

read.csvとwrite.csvも利用できるのでデータフレームの加工したのを保存なんてことも。ファイルのパスに関しては"/content/(ファイル名)"と指定します。

注意点として、ランタイムの接続が切れるとアップロードしたファイルやローカルの変数はなくなるので注意。

作成したipynbファイルのドライブ上でのコピーは不可

Googleドライブ上だけでは上記の作業は行えないので、「作成したファイルをアップロードしドライブ上で複製すれば良いやんけ」となるかもしれませんが、複製した"ipynb"ファイルはColabで開かれないので、新しいファイルを作成したい場合はその都度アップロードする必要がある点には注意。

iPadとかでの使用を前提とするなら、iCloud Drive上に作成したベースのファイルを置いておいて、その都度アップロードするのがベストな方法ですね。

使用感とか

  • コードの補完・ハイライト機能なし
  • tidyverseパッケージは入っている
  • install.packages("hogehoge")でパッケージインストールは可能
  • RStanもインストールできた。でも...
  • ランタイムの接続時間に注意(90分、12時間)

コードの補完機能はなく、RStudioより便利かといわれれば疑問が残るところではありますが、tidyverseパッケージがもともと入っていたり、install.packagesでRStanのインストールも可能などできることの幅が広め。brmsパッケージでStanも走りました。

"A.ipynb"というファイルでパッケージをインストールしたら、"B.ipynb"でもそのパッケージは利用できました。ランタイムの接続が切れるとインストールしたパッケージは再インストールする必要があります。

パソコン以外で実行したいときに

RStudioが構築できる環境であれば、利用することはあまりないかもしれません。どちらかと言うとAndroidやiPadなどのRが動かない環境で使うのに向いていそうです。
実用性は現時点ではないですね....


created by Rinker
Apple(アップル)
¥49,453 (2019/6/7 19:54:46時点 Amazon調べ-詳細)

Source:marketechlabo|makoto-shimizu.com|stackoverflow|Twitter

コメント

タイトルとURLをコピーしました