ETL是什么?
ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL是BI項目中重要的一個環節,用戶從數據源抽取出所需的數據,經過數據清洗,*終按照預先定義好的數據模型,將數據加載到數據倉庫中去,為后續的數據分析提供數據支撐。
市場面上大多BI工具都不含ETL功能,在進行數據分析項目時,通常會用到BI、ETL兩個工具,成本高、花費時間長。而Smartbi推出可視化ETL功能,通過簡單的拖拽就可以完成ETL過程。ETL通常是將多來源的異構數據,進行處理后得到具備完整性、一致性的數據模型。
我們將從Smartbi中的自助ETL的應用場景入手,帶你了解使用自助ETL是如何高數據的質量!
自助ETL場景應用
操作步驟
1、在Smartbi系統主界面的快捷菜單中選擇 數據準備 > 自助ETL,進入“自助ETL”管理界面。

2、在“自助ETL”管理界面中,選擇 新建自助ETL 按鈕,進入“新建ETL”定制界面。

3、在此界面可以設計定制ETL工作流。

1、將關系數據源節點拖入畫布區,在節點配置區設置關系數據源的參數。

2、在關系數據源上右鍵選擇 執行到此處 ,運行當前節點。

3、點擊查看輸出,可查看關系數據源節點輸出的數據,如下:

將表的數據導入當前工作流完成,下面對數據進行 數據預處理 。
需要在表中添加序號,并去除采購金額字段的小數位。
1、將增加序列號節點拖入畫布區,連接兩個節點,設置序列列名稱。

2、將派生列節點拖入畫布區,連接兩個節點。在節點配置區選擇 派生列配置 按鈕。

3、將對應函數和字段分別拖入添加/編輯表達式區,點擊 確定 按鈕,添加一條“采購金額取整”的派生列。

4、在派生列節點上右鍵,選擇 執行到此處 ,運行當前節點。派生列節點輸出的數據如下:

數據預處理完成,下面將處理好的數據輸出。
將處理好的數據輸出成一張新的表。
1、將關系目標源家待拖入畫布區,選擇輸出表的數據源、SCHEMA,并選擇 新建表 按鈕。

2、新的表命名為“產品銷售數據表”,點擊 創建表 按鈕。

3、點擊 運行 按鈕,創建一張新的表。

流程運行完成后,關系目標源節點輸出的數據如下:

一般情況下,ETL過程設計是需要用到大量的代碼,且重復利用率較低。但Smartbi的自助ETL功能充分結合大量項目人員實施習慣,操作敏捷易用,通過封裝ETL算法,將技術分離,以數據源——數據預處理——目標源的形式,實現業務人員進行自助ETL操作。Smartbi自助ETL的主要應用場景是將多來源的異構數據,進行處理后得到具備完整性、一致性的數據模型。使用自助ETL可以提高數據的質量、適應不同的數據分析方法。
免責聲明:當前頁為 業務人員可以進行自助ETL操作?這款BI工具你值得擁有產品信息展示頁,該頁所展示的 業務人員可以進行自助ETL操作?這款BI工具你值得擁有產品信息及價格等相關信息均有企業自行發布與提供, 業務人員可以進行自助ETL操作?這款BI工具你值得擁有產品真實性、準確性、合法性由店鋪所有企業完全負責。世界工廠網對此不承擔任何保證責任,亦不涉及用戶間因交易而產生的法律關系及法律糾紛,糾紛由會員自行協商解決。
友情提醒:世界工廠網僅作為用戶尋找交易對象,就貨物和服務的交易進行協商,以及獲取各類與貿易相關的服務信息的渠道。為避免產生購買風險,建議您在購買相關產品前務必確認供應商資質及產品質量。過低的價格、夸張的描述、私人銀行賬戶等都有可能是虛假信息,請您謹慎對待,謹防欺詐,對于任何付款行為請您慎重抉擇。
投訴方式:fawu@gongchang.com是處理侵權投訴的專用郵箱,在您的合法權益受到侵害時,請將您真實身份信息及受到侵權的初步證據發送到該郵箱,我們會在5個工作日內給您答復,感謝您對世界工廠網的關注與支持!