Spark常見問題診斷

經(jīng)常會遇到如下異常, 某一個task多次失敗導(dǎo)致作業(yè)失敗. 這種情況下因?yàn)槿萜魍顺? 無法查看日志, 已經(jīng)很難判斷具體的失敗原因.

可以參考如下步驟進(jìn)行簡單診斷問題,

1. 點(diǎn)擊如下失敗的stage鏈接,


2. 進(jìn)入如下task列表, 可以看到Index 396就是上面異常中的Task 396,? 而對應(yīng)的四次失敗Attempt 的TID分別是 1165, 1318.

注意:這幾次失敗嘗試發(fā)生的Host完全相同, 表示作業(yè)在同一臺機(jī)器上反復(fù)執(zhí)行這個task 4次并均告失敗, 最終導(dǎo)致作業(yè)失敗. 這種情況就極有可能是當(dāng)時這臺機(jī)器的狀態(tài)不正?;蜇?fù)載偏高導(dǎo)致的


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 轉(zhuǎn)載地址 http://blog.csdn.net/lsshlsw/article/details/4915508...
    Helen_Cat閱讀 5,214評論 0 1
  • 1 數(shù)據(jù)傾斜調(diào)優(yōu) 1.1 調(diào)優(yōu)概述 有的時候,我們可能會遇到大數(shù)據(jù)計算中一個最棘手的問題——數(shù)據(jù)傾斜,此時Spar...
    wisfern閱讀 3,004評論 0 23
  • 一. 運(yùn)維 1. Master掛掉,standby重啟也失效 Master默認(rèn)使用512M內(nèi)存,當(dāng)集群中運(yùn)行的任務(wù)...
    breeze_lsw閱讀 9,430評論 2 32
  • 場景 數(shù)據(jù)傾斜解決方案與shuffle類性能調(diào)優(yōu) 分析 數(shù)據(jù)傾斜 有的時候,我們可能會遇到大數(shù)據(jù)計算中一個最棘手的...
    過江小卒閱讀 3,589評論 0 9
  • 初到深圳,表哥就談到,我?guī)湍憬榻B分工作,沒有問題,但是那樣,我馬上把你趕回去,當(dāng)然我當(dāng)時嘴也蠻硬,說自己找,可是當(dāng)...
    789951af8811閱讀 352評論 0 0

友情鏈接更多精彩內(nèi)容