べにやまぶろぐ

技術寄りの話を書くつもり

お手軽に Spark と SparkR を触るための Dockerfile 書いてみました。

バージョン : Spark 0.9.1

表題の通りですが、こちら。

https://github.com/beniyama/sparkr-dockerbeniyama/sparkr-docker · GitHub

centos のイメージの上にスタンドアローンApache Spark を載せ、更に R 用フロントエンドの SparkR を入れています。

RStudio も入れているので docker run の時にポート 8787 をホスト PC の適当なポートにマップしてブラウザから ID : rstudio / Pass: rstudio でログイン、後は GUI から SparkR のライブラリをロードすればいろいろ遊べるはずです。

詳しくは Readme をご参照ください。