べにやまぶろぐ

技術寄りの話を書くつもり

お手軽に Spark と SparkR を触るための Dockerfile 書いてみました。

バージョン : Spark 0.9.1

表題の通りですが、こちら。

https://github.com/beniyama/sparkr-dockerGitHub - beniyama/sparkr-docker: A Dockerfile to try out SparkR with RStudio frontend.

centos のイメージの上にスタンドアローンな Apache Spark を載せ、更に R 用フロントエンドの SparkR を入れています。

RStudio も入れているので docker run の時にポート 8787 をホスト PC の適当なポートにマップしてブラウザから ID : rstudio / Pass: rstudio でログイン、後は GUI から SparkR のライブラリをロードすればいろいろ遊べるはずです。

詳しくは Readme をご参照ください。