產經情報

Databricks發布Serverless SQL,用戶不須管理伺服器即時獲得SQL運算能力

日期:2021-09-09

Databricks SQL現在新增無伺服器功能Databricks Serverless SQL,簡化用戶處理資料和應用人工智慧的麻煩。該無伺服器服務,能夠提供即時運算能力,使用戶能夠一鍵啟用,不需要調校伺服器效能,或是更新修復程式,以最少管理成本執行商業智慧和SQL運算,官方提到,使用Databricks Serverless SQL降低平均總體成本40%。

Databricks SQL是一個資料湖分析解決方案,用戶能夠在多雲資料湖架構,以較低的成本獲得和資料倉儲相同的效能。Databricks SQL整合像是Tableau和Power BI等商業智慧工具,讓用戶可以用這些工具,查詢資料湖中完整且最新的資料,更方便的是,Databricks SQL提供使用SQL原生介面,補充現有商業智慧工具的不足,讓資料分析師能夠直接在Databricks中查詢資料湖資料,並透過豐富的視覺化工具,來共享資料查詢後的結果,並對資料中的重大變更設置自動警報。

而新的Databricks Serverless SQL則是簡化Databricks SQL系統設置,用戶能夠高效能存取湖邊小屋(Lakehouse)執行商業分析,並且輕鬆擴大存取湖邊小屋即時且豐富的資料集。官方解釋,該功能由一群Databricks所管理的伺服器提供服務,可在數秒之內,轉移運算能力給用戶執行查詢,且只需要對執行報告或是查詢時間支付費用。

Serverless SQL的核心是一個運作伺服器池的運算平臺,該平臺以Databricks帳戶執行Kubernetes容器,在用戶需要的時候,於15秒內將Kubernetes容器分配給用戶,當許多用戶同時執行報告和查詢時,運算平臺會在叢集中添加更多伺服器,來處理更多的負載,所有的伺服器由Databricks管理配置,並且自動修補和升級系統。

這項無伺服器功能,瞄準想要使用自己喜好的商業智慧工具,分析資料湖中資料的資料分析師,用戶可以簡單地將商業智慧工具連接到Serverless SQL,尤其是使用JDBC/ODBC驅動程式的內建連接器,還支援身分驗證。

Serverless SQL是專為商業分析師設計,使用者可以按照自己的步調工作,在需要分析時,即時取用運算能力來處理查詢,用戶不需要等待叢集緩慢啟動或是擴展,管理員也不用手動配置,來啟動和關閉支援分析師工作負載的叢集。

Databricks Serverless SQL提供用戶即時可用的運算能力,而且在預設情況下,叢集只要閒置10分鐘便會自動關閉,刪除資源準備下一次查詢任務,官方表示,仰賴自動調度,Databricks Serverless SQL能夠降低總體成本,維持與任務相當的運算容量,避免用戶在不活動時,過度配置伺服器叢集。

官方強調,每個伺服器具有安全配置,並且所有程序都有三層隔離層保護,分別是Kubernetes容器託管Runtime、託管容器的虛擬機器,以及工作區的虛擬網路,每一層都會被隔離到獨立的工作空間,不共享或是跨網路傳輸流量,容器使用強化配置,虛擬機器一旦關閉後便不再重用,而網路流量則被限制在同一叢集的節點中。

Databricks Serverless SQL和Databricks SQL相比,Databricks Serverless SQL能在十幾秒內啟動完畢,並且提供和Databricks SQL相同的查詢執行速度,不需要花費Databricks SQL數分鐘的啟動時間。目前Databricks Serverless SQL已經在AWS上提供公共預覽版,想嚐鮮的用戶已經可以提出申請。