過來人的職場經(jīng)驗,如何尋找適合自己的企業(yè)? 2022-09-14
但并不是所有人都足夠幸運,能夠快速找到適合自己的測試工作,如果當(dāng)你找到了其它平臺下的測試,也不用過于擔(dān)心,就像小編說的,可能不同的項...詳情>
Flink是如何保證Exactly-once語義? 2022-09-02
Flink通過實現(xiàn)兩階段提交和狀態(tài)保存來實現(xiàn)端到端的一致性語義。分為以下幾個步驟: 開始事務(wù)( beginTransaction ) 創(chuàng)建一個臨時文件夾,來寫...詳情>
CEP復(fù)雜事件處理 2022-09-02
可以針對特定的要求進行復(fù)雜事件處理。例如一個窗口中可以添加CEP功能,對多條件的數(shù)據(jù)進行多次判斷,如果一旦達到標(biāo)準(zhǔn)就觸發(fā)次復(fù)雜事件詳情>
Flink 中的Watermark機制 2022-09-02
Watermark是一種衡量Event Time進展的機制,可以設(shè)定延遲觸發(fā),Watermark是用于處理亂序事件的,而正確的處理亂序事件,通常用Watermark機制結(jié)...詳情>
Flink支持哪幾種重啟策略?分別如何配置? 2022-09-02
重啟策略種類:固定延遲重啟策略(Fixed Delay Restart Strategy)故障率重啟策略(Failure Rate RestartStrategy)無重啟策略(No Restart St...詳情>
Trigger條件觸發(fā)功能 2022-09-02
可以針對時間大小或者數(shù)據(jù)量充當(dāng)條件,在整個窗口未達到標(biāo)準(zhǔn)的時候,進行任務(wù)執(zhí)行,觸發(fā)運行Job。然后當(dāng)編寫trigger后,就需要對流數(shù)據(jù)進行判...詳情>
什么是ETL? 2022-09-02
1. Nginx的日志可以通過Flume抽取到HDFS上。2. Mysql的數(shù)據(jù)可以通過 Sqoop 抽取到 Hive 中,同樣 Hive 的數(shù)據(jù)也可以通過 Sqoop 抽取到 Mysql ...詳情>
遲到的數(shù)據(jù)該怎樣處理? 2022-09-02
一般的app數(shù)據(jù)采集可能會存在數(shù)據(jù)上報延時,因此數(shù)據(jù)會存在兩個時間:數(shù)據(jù)生成的時間和服務(wù)器收到的時間。由于我們底層數(shù)據(jù)都是按時間來做天的...詳情>
ClickHouse支不支持更新? 2022-09-01
但不是真正的更新和刪除,使用:alter table xxx 實現(xiàn) 更新、刪除的數(shù)據(jù),只有在分片時才會真正的清理詳情>
Flume會不會發(fā)生數(shù)據(jù)重復(fù),解釋說明?(常見) 2022-09-01
會,我們在獲取Channel批次數(shù)據(jù)的時候,每個批次是基于一個事務(wù)性的,一旦發(fā)生宕機或者Flume進行掛掉,那么就會回滾,數(shù)據(jù)寫入失敗,下次再重...詳情>
熱問標(biāo)簽 更多>>
在線提問
專業(yè)導(dǎo)師線上坐鎮(zhèn),解答個性化學(xué)習(xí)難題
提交問題