歡迎關(guān)注筆者的公眾號:【阿飛的博客】,首發(fā)都在這里?。?! LinkedIn中的個人主頁是訪問量最多的頁面之一,它允許其他人訪問你的個人主頁,從而了解你的專業(yè)技能,經(jīng)驗和興趣等...
歡迎關(guān)注筆者的公眾號:【阿飛的博客】,首發(fā)都在這里?。?! LinkedIn中的個人主頁是訪問量最多的頁面之一,它允許其他人訪問你的個人主頁,從而了解你的專業(yè)技能,經(jīng)驗和興趣等...
隨著Apache Parquet和Apache ORC等存儲格式以及Presto和Apache Impala等查詢引擎的發(fā)展,Hadoop生態(tài)系統(tǒng)有潛力作為面向分鐘級延時場景...
問題背景 筆者所在的部門屬于公司的大數(shù)據(jù)架構(gòu)部,現(xiàn)主要參與公司流式計算平臺的推廣,個人負責spark的平臺維護、特性定制、線上問題修改等。為了方便業(yè)務(wù)用戶提交spark應(yīng)用。...
針對數(shù)據(jù)亂序的需求,需要使用eventtime和watermark來解決。 watermarks的生成方式有兩種: With Periodic Watermarks:周期性的...
Window是無限數(shù)據(jù)流處理的核心,Window將一個無限的stream拆分成有限大小的”buckets”桶,我們可以在這些桶上做計算操作。本文主要聚焦于在Flink中如何進...
摘要 Flink 認為 Batch 是 Streaming 的一個特例,所以 Flink 底層引擎是一個流式引擎,在上面實現(xiàn)了流處理和批處理。而窗口(window)就是從 S...
Apache Flink(下簡稱Flink)項目是大數(shù)據(jù)處理領(lǐng)域最近冉冉升起的一顆新星,其不同于其他大數(shù)據(jù)項目的諸多特性吸引了越來越多人的關(guān)注。本文將深入分析Flink的一些...
Overview Savepints是外部存儲的checkpoint,你可以通過該checkpoint來停止,重復消費和更新你的Flink程序。使用Flink的checkpo...