本系列文章主要索引如下: 一、ETL利器Kettle實戰(zhàn)應用解析系列一【Kettle使用介紹】 二、ETL利器Kettle實戰(zhàn)應用解析系列二 【應用場景和實戰(zhàn)DEMO下載】 三、ETL利器Kettle實戰(zhàn)應用解析系列三 【ETL后臺進程執(zhí)行配置方式】 本文主要閱讀目錄如下:
ETL(Extract-Transform-Load的縮寫,即數據抽取、轉換、裝載的過程),對于企業(yè)或行業(yè)應用來說,我們經常會遇到各種數據的處理,轉換,遷移,所以了解并掌握一種etl工具的使用,必不可少,這里我介紹一個我在工作中使用了3年左右的ETL工具Kettle,本著好東西不獨享的想法,跟大家分享碰撞交流一下!在使用中我感覺這個工具真的很強大,支持圖形化的GUI設計界面,然后可以以工作流的形式流轉,在做一些簡單或復雜的數據抽取、質量檢測、數據清洗、數據轉換、數據過濾等方面有著比較穩(wěn)定的表現,其中最主要的我們通過熟練的應用它,減少了非常多的研發(fā)工作量,提高了我們的工作效率,不過對于我這個.net研發(fā)者來說唯一的遺憾就是這個工具是Java編寫的。 Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,綠色無需安裝,數據抽取高效穩(wěn)定。 Kettle 中文名稱叫水壺,該項目的主程序員MATT 希望把各種數據放到一個壺里,然后以一種指定的格式流出。 Kettle這個ETL工具集,它允許你管理來自不同數據庫的數據,通過提供一個圖形化的用戶環(huán)境來描述你想做什么,而不是你想怎么做。 Kettle中有兩種腳本文件,transformation和job,transformation完成針對數據的基礎轉換,job則完成整個工作流的控制。 Kettle可以在http://kettle./網站下載
下載kettle壓縮包,因kettle為綠色軟件,解壓縮到任意本地路徑即可
3、Kettle環(huán)境配置(有Java環(huán)境的直接忽略此章節(jié)) 3、1 安裝java JDK 1)首先到官網上下載對應JDK包,JDK1.5或以上版本就行; 2)安裝JDK; 3)配置環(huán)境變量,附配置方式: 安裝完成后,還要對它進行相關的配置才可以使用,先來設置一些環(huán)境變量,對于Java來說,最需要設置的環(huán)境變量是系統(tǒng)路徑變量path。 (1)要打開環(huán)境變量的設置窗口。右擊“我的電腦”,在彈出的快捷菜單中選擇“屬性”選項,進入“系統(tǒng)屬性”對話框,如圖所示。選擇“高級”標簽,進入“高級”選項卡,再單擊“環(huán)境變量”按鈕,進入“環(huán)境變量”對話框,如圖所示: (2)在“Administrator的用戶變量”列表框中,選擇變量PATH,待其所在行變高亮后,單擊“編輯”按鈕,如圖所示。 (3)在彈出的“編輯系統(tǒng)變量”對話框中,將JDK安裝路徑下的bin目錄路徑設置到Path變量中,如圖所示。 編輯完后,單擊“確定”按鈕,進行保存,環(huán)境變量Path的設置就正式完成。 注意:設置Path變量的路徑,必須是JDK安裝目錄中的bin目錄,有時候在JDK安裝目錄的同一層會有JRE的安裝目錄,因此請謹慎選取相關路徑,避免將路徑設置成JRE目錄下的bin目錄。 3、2 測試JDK配置是否成功 設置好環(huán)境變量后,就可以對剛設置好的變量進行測試,并檢測Java是否可以運行。 (1)單擊“開始”按鈕,選擇“運行”選項,在“運行”對話框中輸入cmd命令。 (2)之后單擊“確定”按鈕,打開命令行窗口。 (3)在光標處輸入:javac命令,按下Enter鍵執(zhí)行,即可看到測試結果 3、3 運行Kettle 進入到Kettle目錄,如果Kettle部署在windows環(huán)境下,雙擊運行spoon.bat或Kettle.exe文件,出現如下界面:
這樣配置環(huán)境這一塊基本上就完成了。
4.1 Kettle使用
Kettle提供了資源庫方式的方式來整合所有的工作,但是因為資源庫移植不方便,所以我們選擇沒有資源庫;
1)創(chuàng)建一個新的transformation,點擊 保存到本地路徑,例如保存到D:/etltest下,保存文件名為EtltestTrans,kettle默認transformation文件保存后后綴名為ktr;
2)創(chuàng)建一個新的job,點擊 保存到本地路徑,例如保存到D:/etltest下,保存文件名為EtltestJob,kettle默認job文件保存后后綴名為kjb;4.2 組件樹介紹
4.3 Transformation轉換介紹
每一個環(huán)節(jié)可以通過鼠標拖動來將環(huán)節(jié)添加到主窗口中。
并可通過shift+鼠標拖動,實現環(huán)節(jié)之間的連接。
轉換常用環(huán)節(jié)介紹
4.3 Job任務介紹
常用環(huán)節(jié)介紹
大家如果感興趣可以繼續(xù)閱讀系列:二、ETL利器Kettle實戰(zhàn)應用解析系列二 【應用場景和實戰(zhàn)DEMO下載】
|
|
來自: icecity1306 > 《可能用到系統(tǒng)》