Google表示,BigQuery用戶可透過建立BigLake表格,將任務延伸到於Google Cloud Storage、Amazon S3或Azure Data Lake Storage Gen2上的資料庫。(圖片來源/Google)

Google於本周舉行的雲端資料高峰會(Cloud Data Summit)上,發表新的統一儲存引擎BigLake,它能夠橫跨不同的雲端與格式,提供一致的粒度存取控制,簡化使用者存取資料倉儲與資料湖的流程。

Google指出,組織的資料日趨複雜,它們可能以多種格式散置在不同的環境或孤島上,而讓風險與成本日益增加,特別是需要轉移資料的時候,而BigLake則讓組織得以統一資料倉儲與資料湖,使團隊可以在不管底層的儲存系統或格式下分析資料,還能消除複製或遷移資料的需求。

事實上,BigLake是將Google BigQuery的能力延伸到多雲儲存中,包括AWS與Azure,且藉由開放格式來確保一個統一卻又彈性的資料湖架構。

BigLake支援諸如Parquet與ORC等開放格式,而且提供粒度安全控制;得以保留單一的資料備份,在不同的分析引擎中採用一致的存取控制,包括Google Cloud或開源的Spark、Presto、Trino與Tensorflow等;並透過與Google Cloud Dataplex的無縫整合進行統一管理。

圖片來源/Google

具體而言,BigQuery用戶可透過建立BigLake表格,將任務延伸到於Google Cloud Storage、Amazon S3或Azure Data Lake Storage Gen2上的資料庫,資料管理員可利用政策標籤於BigLake表格上就表格或行、列配置安全功能。

當管理人員建立BigLake表格之後,使用者即可像使用其它BigQuery表格一樣進行查詢,而且每一名使用者只會看到被授權存取的部分。


熱門新聞

Advertisement