上一節(jié):kettle——(1)介紹和Execl輸出舉例 最近公司在做數(shù)據(jù)總線的工作,,需要用kettle這個(gè)ETL工具,所以花了一些時(shí)間來研究研究,,喜歡的話點(diǎn)個(gè)贊 kettle抽取一個(gè)數(shù)據(jù)庫中數(shù)據(jù),,同步到另一數(shù)據(jù)庫1.新建一個(gè)“轉(zhuǎn)換”,新建兩個(gè)數(shù)據(jù)庫連接如下:目標(biāo)數(shù)據(jù)庫MySQL 源數(shù)據(jù)庫SQL Server 2.拖入“輸入表”和“輸出表”輸入表:選擇相應(yīng)的數(shù)據(jù)庫,,可以直接獲取sql語句 輸出表:選擇相應(yīng)的數(shù)據(jù)庫,,填寫目標(biāo)表(同步數(shù)據(jù)用的表),可以直接獲取sql語句 沒有連接導(dǎo)致字段不可讀 按住shift之后便可以連線 目標(biāo)數(shù)據(jù)庫中沒有相應(yīng)的表,,需要新建 執(zhí)行 3.運(yùn)行轉(zhuǎn)化文件即可以上說的是完全同步一張表的情況,,而且前提是——在目標(biāo)數(shù)據(jù)庫中沒有同名的表 如果我只需要這張表中的某些字段應(yīng)該怎么辦 4.根據(jù)自己的需要?jiǎng)h除或者修改字段,再同步數(shù)據(jù)源數(shù)據(jù)表 添加“字段選擇” 編輯“字段選擇”,,獲取字段 移除自己不需要的字段:先獲取,,然后右擊——?jiǎng)h除 修改字段(這里偷懶沒有寫,自行腦補(bǔ)哈) “輸出表”運(yùn)行SQL語句,,建立新表如下: 最后結(jié)果 以上的同步數(shù)據(jù)是在目標(biāo)數(shù)據(jù)庫中沒有這張表的情況下,,如果目標(biāo)數(shù)據(jù)庫中已經(jīng)存在這張表了呢? 5.同步目標(biāo)數(shù)據(jù)庫已存在的表源數(shù)據(jù)庫表數(shù)據(jù)如下: 目標(biāo)數(shù)據(jù)庫表數(shù)據(jù)如下: 修改字段選擇,,刪除字段create_time(同步的數(shù)據(jù)沒有這一列的數(shù)據(jù)) 修改輸出表對應(yīng)已存在的表 最后結(jié)果 |
|