久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

下秒數(shù)據(jù)CEO蔡致暖:云原生時代數(shù)據(jù)管道的迭代之路

 黃爸爸好 2022-08-18 發(fā)布于上海

在如今數(shù)據(jù)被稱為新經(jīng)濟時代的石油的大背景下,,數(shù)據(jù)管道是什么,?處于什么位置?其技術(shù)和演進趨勢又是怎么樣的,?

2022年7月12日,,在CSDN云原生系列在線峰會第13期“現(xiàn)代數(shù)據(jù)棧峰會”上,針對這些連續(xù)發(fā)問,,下秒數(shù)據(jù)CEO蔡致暖對數(shù)據(jù)管道1.0至3.0的迭代過程及技術(shù)特點進行了詳細介紹,。

圖片

數(shù)據(jù)管道和ETL

數(shù)據(jù)管道是一種重要的數(shù)據(jù)基礎(chǔ)設(shè)施,ETL管道是最常用的數(shù)據(jù)管道,。

數(shù)據(jù)基礎(chǔ)設(shè)施是底座,,數(shù)據(jù)管道作為數(shù)據(jù)庫及數(shù)據(jù)倉庫的最佳拍檔,也是一種重要的數(shù)據(jù)基礎(chǔ)設(shè)施,。

圖片

在了解數(shù)據(jù)管道具體是什么之前,,首先要了解什么是ETL管道。ETL管道是從其源系統(tǒng)/數(shù)據(jù)庫中提取數(shù)據(jù),,對數(shù)據(jù)進行轉(zhuǎn)換,,然后將其加載到數(shù)據(jù)倉庫或數(shù)據(jù)庫中,從中獲取業(yè)務(wù)見解,。

數(shù)據(jù)管道包含ETL管道,,因為對于數(shù)據(jù)管道來說,數(shù)據(jù)的目的地不一定是數(shù)據(jù)庫或數(shù)據(jù)倉庫,,也可以是其他的應(yīng)用程序,,并且支持整個組織的數(shù)據(jù)編排,、管理和使用。

數(shù)據(jù)管道中的步驟通常包括提取,、轉(zhuǎn)換,、組合、驗證,、可視化以及其他此類數(shù)據(jù)分析過程,。如果沒有數(shù)據(jù)管道,這些過程需要大量耗時而繁瑣的手動步驟,,并給人為錯誤留下空間,。數(shù)據(jù)管道的最佳類比是傳送帶,它能高效,、準確地將數(shù)據(jù)傳送到流程的每一步,。例如,數(shù)據(jù)管道可幫助數(shù)據(jù)從SaaS應(yīng)用高效地流向數(shù)據(jù)倉庫等,。

為什么說數(shù)據(jù)管道是重要的數(shù)據(jù)基礎(chǔ)設(shè)施,?

現(xiàn)如今企業(yè)數(shù)據(jù)孤島變得普遍,各類SaaS應(yīng)用的使用頻率越來越高,。數(shù)據(jù)管道解決的是如何自動化地把不同來源的數(shù)據(jù)傳遞給組織中的人,、系統(tǒng)、應(yīng)用程序,,并將數(shù)據(jù)轉(zhuǎn)化為業(yè)務(wù)價值,。數(shù)據(jù)管道扮演的不僅僅是一個數(shù)據(jù)傳送帶的作用,它還需要把不同來源的數(shù)據(jù),,經(jīng)過技術(shù)手段變成業(yè)務(wù)價值再傳送出去,,最終讓組織方便地使用數(shù)據(jù)。

圖片

數(shù)據(jù)管道1.0:ETL技術(shù)和數(shù)據(jù)倉庫

圖片

數(shù)據(jù)管道1.0的關(guān)鍵詞是ETL與數(shù)據(jù)倉庫,,基于傳統(tǒng)ETL技術(shù)構(gòu)建數(shù)據(jù)倉庫的的過程可劃分為五步:
  • 定義數(shù)據(jù)項目及相關(guān)業(yè)務(wù)需求,;
  • 確定項目的相關(guān)數(shù)據(jù)源;
  • 定義特定業(yè)務(wù)問題所需的數(shù)據(jù)模型(Schema),;
  • 構(gòu)建ETL管道(提取,、轉(zhuǎn)換和加載函數(shù));
  • 進行數(shù)據(jù)分析并獲得業(yè)務(wù)見解,。

其關(guān)鍵特征在于,,數(shù)據(jù)在加載到數(shù)據(jù)倉庫之前需進行轉(zhuǎn)換。這是因為在20世紀90年代,,存儲,、計算和帶寬十分昂貴,因此在將數(shù)據(jù)裝入倉庫之前減少數(shù)據(jù)量至關(guān)重要,。

傳統(tǒng)ETL技術(shù)的局限性

隨著數(shù)據(jù)處理技術(shù)的不斷演進,,傳統(tǒng)ETL技術(shù)難以適應(yīng)業(yè)務(wù)的發(fā)展,,有較多弊端顯現(xiàn):

  • 不夠靈活、伸縮性差,,一旦業(yè)務(wù)規(guī)則變化,,管道需重新設(shè)計;
  • 持續(xù)維護,,開發(fā)工程師要深度參與,,維護成本
  • 技術(shù)復雜,,可以使用各種不同的編程語言

案例解析——業(yè)務(wù)邏輯稍復雜,,維護成本奇高無比
圖片

上圖是一個典型的使用Kettle構(gòu)建的數(shù)據(jù)管道,,涉及節(jié)點數(shù)量20余。在業(yè)務(wù)變化和需求修改增多的情況下,,數(shù)據(jù)管道的復雜度和維護成本都會奇高無比,。

圖片

數(shù)據(jù)管道2.0:ELT和云計算/大數(shù)據(jù)

數(shù)據(jù)管道2.0的主要目標依舊是構(gòu)建數(shù)據(jù)倉庫,其關(guān)鍵詞是ELT與云計算/大數(shù)據(jù),。

在2.0階段,,我們將ETL技術(shù)更換為ELT技術(shù),這是因為隨著大數(shù)據(jù)與云計算的發(fā)展,,存儲,、計算和帶寬成本大幅下降,組織可以在數(shù)據(jù)倉庫中加載大量未轉(zhuǎn)換的數(shù)據(jù),,而不必擔心成本和限制,。

圖片

ELT管道從源系統(tǒng)中提取數(shù)據(jù)并將其直接加載到數(shù)據(jù)倉庫中,無需進行轉(zhuǎn)換,。數(shù)據(jù)入庫后針對特定業(yè)務(wù),,基于SQL或DBT(SQL擴展)等工具進行轉(zhuǎn)換和建模。

ELT解決了傳統(tǒng)ETL技術(shù)的痛點

  • ELT更加靈活,,每個數(shù)據(jù)源的數(shù)據(jù)都可以存入庫中,,EL過程不涉及業(yè)務(wù)轉(zhuǎn)化,可以實現(xiàn)標準化,,進而可以按需擴展數(shù)據(jù)源,、按需建模;
  • ELT更加普適,,轉(zhuǎn)換和建模不再依賴編程語言,,入庫后使用SQL即可
  • ELT更加健壯,,轉(zhuǎn)換層的故障上游架構(gòu)下游數(shù)據(jù)模型更改不會阻止數(shù)據(jù)加載,。

圖片

數(shù)據(jù)管道3.0:連接器和API經(jīng)濟

雖然數(shù)據(jù)管道2.0已經(jīng)實現(xiàn)了將數(shù)據(jù)都存入數(shù)據(jù)倉庫中,,但轉(zhuǎn)換和建模依然對技術(shù)具有高要求。以往做數(shù)據(jù)集成多以數(shù)據(jù)庫或文件為目標,,但隨著近年來SaaS應(yīng)用的普及,,組織使用不同的應(yīng)用及工具開展營銷和經(jīng)營活動,數(shù)據(jù)集成的技術(shù)門檻并沒有因為ELT的到來而降低,。
數(shù)據(jù)管道3.0——基于連接器和API經(jīng)濟,,自動化價值數(shù)據(jù)的流動

實際上,數(shù)據(jù)管道3.0及數(shù)據(jù)管道2.0的ELT都是現(xiàn)代數(shù)據(jù)棧的組成部分,。相較數(shù)據(jù)管道2.0,,數(shù)據(jù)管道3.0主要在兩個方面做出了改變。

  • 數(shù)據(jù)連接器的標準化和商品化:ELT為數(shù)據(jù)連接器的標準化打下了堅實基礎(chǔ),,將問題轉(zhuǎn)換為如何使數(shù)據(jù)連接器更易于構(gòu)建,;
  • 數(shù)據(jù)分析結(jié)果不應(yīng)該封閉在數(shù)據(jù)倉庫或BI工具中,應(yīng)該通過API數(shù)據(jù)編排自動化,,推動組織中價值數(shù)據(jù)的流動,,如反向ETL

圖片

數(shù)據(jù)管道3.0的主要特征

  • 用戶特征

    • 關(guān)注技術(shù),,通過簡單的配置就可以完成數(shù)據(jù)的連接處理分析,,降低開發(fā)人員依賴

    • 彈性的工作負載,,按用量付費,。

  • 技術(shù)特征
    • 連接器標準化,數(shù)據(jù)集成可重用,,大幅降低數(shù)據(jù)集成的成本及技術(shù)門檻,;
    • 轉(zhuǎn)換、建模以數(shù)據(jù)倉庫和SQL為中心,。
  • 生態(tài)特征
    • 易與其他工具(包括傳統(tǒng)ETL工具)集成,;
    • 利用社區(qū)的力量來構(gòu)建與維護連接器和模板化的數(shù)據(jù)模型。

圖片

總結(jié)

數(shù)據(jù)管道是一項重要的數(shù)據(jù)基礎(chǔ)設(shè)施,,使用智能數(shù)據(jù)管道技術(shù),,能夠幫助組織將所有應(yīng)用程序、數(shù)據(jù)庫,、事件和文件等數(shù)據(jù)信息提取到數(shù)據(jù)倉庫中,,并快速將分散的數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)集、API,、自動化流程等開箱即用的數(shù)據(jù)服務(wù),,釋放數(shù)據(jù)的價值。

圖片

END


圖片

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,,謹防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多