SearchとSparkノートブックでベイエリアのBikeShareデータを解析

Published on 08 July 2015 in Hue 3.9 / Search / Spark / Tutorial - 2 minutes read - Last modified on 04 February 2020

このチュートリアルはBay Area BikeShare のパブリックデータを使用し、プラットフォームの利用量をさらに理解するために、自転車の移動パターンとそのユーザーを可視化します。Hueではデータを充実させるために、動的な検索ダッシュボードだけでなく、新しくSparkのノートブックも提供しています。

私たちはhttp://www.bayareabikeshare.com/datachallengeのデータセットを用いて始めることをお勧めしますが、せっかちな方のために、インデックス作成の準備ができた一部の移動(trips)データも、また、後ほどSparkにより処理される気象データ(weather data)も提供しています。Hueのノートブックはダウンロードしてインポート、または単純にコピーしてペーストすることができます 。

 

このリアルタイムSpark Streamingを組み合わせたデモは、Hadoop SummitおよびBig Data Day LAのようなカンファレンスで紹介しています 。

Happy Biking!

 

 

solr-bike-dashboard

ドラッグ&ドロップで作成されたインタラクティブなダッシュボードの例

 

いつものように、コメントとフィードバックは hue-user メーリングリストや@gethueまでお気軽に!

 

ヒント

Solrでデータをインデックスする簡単な方法:

bin/solr create_collection  -c  bikes

URL=http://localhost:8983/solr
u="$URL/bikes/update?commitWithin=5000"
curl $u --data-binary @/home/test/index_data.csv -H 'Content-type:text/csv'

comments powered by Disqus

More recent stories

10 June 2021
Hue4.10(新しいSQLエディタコンポーネント、REST API、小さなファイルのインポート、Slackアプリなど)がリリースされました!
Read More
29 May 2021
Sqlスクラッチパッドコンポーネントとパブリック REST API を使用して、5 分で独自の SQL エディター (BYOE) を構築する
Read More
26 May 2021
改善されたHueのImporter -- ファイルの選択、方言の選択、テーブルの作成
Read More