'ETL實戰(zhàn)四天

第四天

對MySQL庫的數(shù)據(jù)進(jìn)行采集,篩選去除臟數(shù)據(jù)。

第五天

采集后臺日志數(shù)據(jù)

模擬后臺日志數(shù)據(jù),

1.讀取文件

2.從MySQL元數(shù)據(jù)庫中查詢是否處理過

3.進(jìn)行對比,找出沒有被處理的文件,進(jìn)行采集

4讀取每一行文件

5將每一行轉(zhuǎn)化成model

6調(diào)用model生成sql語句,插入MySQL

7將model調(diào)用寫的工具轉(zhuǎn)化為csv:用的split()函數(shù)

8.記錄元數(shù)據(jù)本次有哪些文件被處理

9.結(jié)束

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容