Hue は10周年を迎えました。Hueは、Apache Hadoop が主流になる前のまだ初期段階だった時に作成されました(詳細は Hadoop is Dead. Long live Hadoop のHadoopストーリーをご覧ください)。
Hueは元々Cloudera Managerの一部であり、プロプライエタリかつ管理者により重点をおいていましたが、その後バージョン 0.3で独自のオープンソースプロジェクトに移行しました。Hueはデスクトップのようなアプリケーションから現代的な単一ページのSQLエディタへと徐々に進化しました(現在はバージョン4.6 です)。
継続的な繰り返しを通して、Hue はその主な目的である「データプラットフォームの使いやすさを促進する」という点で改善を続けました。ユーザーのベースは、主にクエリしたデータを見る人で構成されています。一例として、
- アドホックな質問に答えるデータアナリスト
- 使用状況の統計を見るプログラムマネージャー
- データアプリを構築する IT/SQL 開発者
- システムのユーザービリティ全体を調べるデータアーキテクト
- データウェアハウスのテーブル作成を育成するデータエンジニア
2番目のカテゴリーは、ジョブのログを表示、HDFS や AWS S3 のような分散ファイルシステムへのデータのアップロード、ワークフローの作成、検索ダッシュボードの作成、クエリの最適化を行いたいなどの技術的なユーザーです。
Hue 1 (2009) - Apache Hive エディタ、Hadoop のファイルブラウザ、ジョブブラウザーを備えたデスクトップ感覚のアプリケーション。
Hue 2 (2012) - フラットなデザイン、データプラットフォームに高度なSQLエディタ、適切なセキュリティを備えた15以上の新しいアプリケーション/コネクターを追加 (テーブルのブラウジング、ワークフローの構築、検索ダッシュボードなど)
Hue 3 (2013) - 単一のエクスペリエンスにアプリケーションを集約および相互リンクして、単一ページのエディタ、およびさらに強力なSQLインテリジェンスを提供
Hue 4 (2017) - Hue はインターフェースを大幅に改良して、モダンでシンプルな単一ページになった。スマートなリコメンドによるSQLのインテリジェンス、リスク警告、データカタログの統合を備えた、SQLインテリジェンスの次のステップ
より多くのユーザーとより多くのSQL
Cloudera (CDH) と Hortonworks (HDP) ディストリビューションをCDP (Cloudera Data Platform, Data Center またはクラウドで利用可能)に統合することで、Hueはどこにでもあり、さらに多くのユーザーが利用できるようになりました。
- 1000人以上の複合的な顧客 (Fortune 500 社の重要な一部を含む)
- Hue経由で毎日数10万件のSQLクエリが実行されている
アップストリームのHueは、AWS EMR, IBM Open Data Hubなどの他のいくつかのディストリビューションにも含まれており、活発なコミュニティがあります。
Hue 4.6 (2019) - コンポーネント化が継続され、クラウドでのSQLクエリとファイルの閲覧のためデータウェアハウスの統合を強化
2020年に予定されているHue 5はさらにデータウェアハウスに特化しており、最高の SQL クラウドエディタを提供することに注力しています。
- まず、Apache Hive と Apache Impala SQL エンジンのサポートがより深くなっています。SQLインターフェースも安定したコンポーネントに改良されており、Apache Calcite ファミリーやApache Phoenix, Apache Druid, Apache Flink SQL などを簡単に受け入れられます。より高度なクエリ共有と同様に、スマートなインテリジェンスとクエリ最適化のためのアシスタントとのコラボレーションを強化しています。
- 次に「クラウド対応」であり、コンテナのスケールアップとスケールダウンの自動化されたインフラの世界にうまく適合します。Kubernetes 上のHue の最初のバージョンは既に出荷されており、より大規模でよりシンプルな運用管理ができるようになっています。
Hueの10年間にわたる進化のシリーズのパート2では、SQLクラウドエディタノクエリ機能についてさらに詳しく掘り下げます。それまでは、このページまたはフォーラム に気軽にコメントして、quick start で SQL のクエリを行なってください!
Romain, from the Hue Team