このチュートリアルはBay Area BikeShare のパブリックデータを使用し、プラットフォームの利用量をさらに理解するために、自転車の移動パターンとそのユーザーを可視化します。Hueではデータを充実させるために、動的な検索ダッシュボードだけでなく、新しくSparkのノートブックも提供しています。
私たちはhttp://www.bayareabikeshare.com/datachallengeのデータセットを用いて始めることをお勧めしますが、せっかちな方のために、インデックス作成の準備ができた一部の移動(trips)データも、また、後ほどSparkにより処理される気象データ(weather data)も提供しています。Hueのノートブックはダウンロードしてインポート、または単純にコピーしてペーストすることができます 。
このリアルタイムSpark Streamingを組み合わせたデモは、Hadoop SummitおよびBig Data Day LAのようなカンファレンスで紹介しています 。
Happy Biking!
いつものように、コメントとフィードバックは hue-user メーリングリストや@gethueまでお気軽に!
ヒント
Solrでデータをインデックスする簡単な方法:
bin/solr create_collection -c bikes
URL=http://localhost:8983/solr
u="$URL/bikes/update?commitWithin=5000"
curl $u --data-binary @/home/test/index_data.csv -H 'Content-type:text/csv'