新しいSpark Web UI: Sparkアプリ

Published on 02 January 2014 in Spark / Tutorial / Video - 2 minutes read

Sparkの開発者の皆様!

最近HueのSparkアプリケーションが作成されました。これはユーザーがブラウザから直接Sparkジョブの実行と監視ができ、より生産的になります。

以前Oozieのバックエンドでサブミットするアプリをリリースしましたが、最近のSpark SummitOoyalaEvanのチームによってコントリビュートされた、Spark Job Server (SPARK-818) に変更しました。この新しいサーバーはSparkとの実際の双方向性を有効にし、コミュニティに近づいています。

 

私たちはコミュニティと一緒に作業して、将来的にPython、Javaのサポート、コンパイル/アップロードなく直接ジョブをサブミット、その他の改善ができることを願っています!

いつものように、コメントがあれば hue-user リストあるいは @gethueまで!Job Serverに直接関する質問については、SPARK-818pull requestに参加するかSparkのメーリングリストまで!

始めましょう!

現在、Scalaジョブのみがサポートされており、プログラムはこのトレイトを実装してjarにパッケージする必要があります。これがWordCountの例です。Spark Job Serverについて学習するにはREADMEを確認して下さい。

要件

システムにはScalaがインストールされていると仮定しています。

Spark Job Serverを取得する

現在githubのこのbranchにあります:

git clone https://github.com/ooyala/incubator-spark.git spark-server
cd spark-server
git checkout -b jobserver-preview-2013-12 origin/jobserver-preview-2013-12

それからこのように入力します:

sbt/sbt
project jobserver
re-start

Hueを取得する

現在githubのみにあります (CDH5b2に含まれる予定です):

https://github.com/cloudera/hue#getting-started

HueとSpark Job Serverが同じマシンにない場合、desktop/conf/pseudo-distributed.iniにあるhue.iniのプロパティを更新します:

[spark]
  # URL of the Spark Job Server.
  server_url=http://localhost:8090/

実行するためにSparkのサンプルを取得する

その後、このThen follow this 手順(ウォークスルー) に従い、ビデオのデモで使用しているサンプルのjarを作成します。


comments powered by Disqus

More recent stories

10 June 2021
Hue4.10(新しいSQLエディタコンポーネント、REST API、小さなファイルのインポート、Slackアプリなど)がリリースされました!
Read More
29 May 2021
Sqlスクラッチパッドコンポーネントとパブリック REST API を使用して、5 分で独自の SQL エディター (BYOE) を構築する
Read More
26 May 2021
改善されたHueのImporter -- ファイルの選択、方言の選択、テーブルの作成
Read More