Hiveテーブルの作成とクォートされたCSVデータのロード

Published on 27 November 2013 in Hive / Metastore / Tutorial / Video - 1 minute read - Last modified on 04 February 2020 - Read in en

HueはHiveテーブルの作成を簡単にします。

HUE-1746では、Hueがデータを直接調べることで、列名と型(整数、文字列、浮動小数点など)を推測します。データの先頭がヘッダから始まっている場合、ヘッダ行が自動的に使用され、テーブルの作成時にヘッダ行をスキップします。

クォートされたCSVのフィールドも、HUE-1747のおかげで互換性を持ちます。

これが使用しているデータファイルです:

http://www.fdic.gov/bank/individual/failed/banklist.html

こちらはクォートされたCSVを読むためのSerDeです:

https://github.com/ogrodnek/csv-serde

そして、テーブルがSerDeを使用するようにするためのコマンドです:

ALTER TABLE banks SET SERDE 'com.bizo.hive.serde.csv.CSVSerde'

さぁ、HiveImpala、またはPigエディタでデータを分析しましょう!


comments powered by Disqus

More recent stories

10 June 2021
Hue4.10(新しいSQLエディタコンポーネント、REST API、小さなファイルのインポート、Slackアプリなど)がリリースされました!
Read More
29 May 2021
Sqlスクラッチパッドコンポーネントとパブリック REST API を使用して、5 分で独自の SQL エディター (BYOE) を構築する
Read More
26 May 2021
改善されたHueのImporter -- ファイルの選択、方言の選択、テーブルの作成
Read More