記一次spring-boot 項目OOM問題排查過程

? ? 最近新做了一個告警監(jiān)控的APP項目,后臺代碼只有用戶登錄管理和告警查詢模塊,業(yè)務量特別少,項目部署服務器上后,發(fā)現(xiàn)內(nèi)置直接飆升至2G,甚至直接OOM,導致服務器系統(tǒng)重啟,于是開始尋找原因。

1、首先排查代碼,看代碼是否存在死循環(huán)及循環(huán)引用等情況,經(jīng)過詳細排查后,并沒有發(fā)現(xiàn)任何問題。

2、可能沒有設置合適的jvm啟動參數(shù),于是設置該參數(shù) 。(參考鏈接

java -Xms256m -Xmx512m -XX:ParallelGCThreads=2 -Djava.compiler=NONE -jar monitor-0.0.1-SNAPSHOT.jar

通過設定Xmx(程序運行期間最大可占用的內(nèi)存大小)、Xss(jvm啟動的每個線程分配的內(nèi)存大小)、XX:ParallelGCThreads(GC線程數(shù))以及關閉了JIT功能,達成了降低內(nèi)存占用的目的。

3、設置項目jvm參數(shù)后內(nèi)存沒有繼續(xù)上升,但是在運行過程中,發(fā)現(xiàn)內(nèi)存會上升到600M左右,自以為能夠穩(wěn)定運行了,結(jié)果運行了2個小時后又OOM了

Exception in thread "http-nio-8080-exec-3" Exception in thread "http-nec-4" java.lang.OutOfMemoryError: Java heap space

? ? ? ? at java.nio.HeapByteBuffer.<init>(Unknown Source)

? ? ? ? at java.nio.ByteBuffer.allocate(Unknown Source)

4、使用jmap進行抓包分析后發(fā)現(xiàn),無論是否內(nèi)存溢出,都會存在幾個對象占用特別大的內(nèi)存。

這個對象是什么情況,代碼里面沒有用到呀,

5、看線程名稱應該是tomcat的nio工作線程,

第一步:打開Histogram看看占用內(nèi)存最大的是什么對象:

可以看到byte數(shù)組占用了接近JVM配置的最大堆的大小也就是400M,顯然這是OOM的原因。

第二步: 看一下究竟是哪些byte數(shù)組,數(shù)組是啥內(nèi)容,可以看出很明顯這和HTTP請求相關。

為了進一步驗證猜想,關閉前端調(diào)用,只啟動后臺進程,此時發(fā)現(xiàn)內(nèi)存占用僅在200M左右。進一步使用jmap抓包,沒有發(fā)現(xiàn)之前內(nèi)存比較大的那幾個對象。當任意調(diào)用幾個接口后,內(nèi)存再次飆升,繼續(xù)抓包分析,發(fā)現(xiàn)又出現(xiàn)了幾個97.4M的對象,由此已經(jīng)可以確定,此OOM問題肯定與http請求和tomcat有關。進一步猜想可能是設置了什么不合理的啟動參數(shù)導致。(一般而言一次請求,不可能會占用這么大的內(nèi)存。)

第三步: 通過查看GC根查看誰持有了數(shù)組的引用:

這符合之前的猜測,是tomcat的線程在處理過程中分配了97.7M的buffer在堆上。

第四步: 檢查代碼里是否有tomcat或服務器相關配置,看到有這么一個配置:

server.maxHttpHeaderSize=102400000

server.tomcat.max-http-post-size=102400000

至此,基本已經(jīng)確定了可能就是這個不合理的最大配置參數(shù)導致的問題。注銷該代碼后,進一步部署驗證,發(fā)現(xiàn)問題已解決。

參考鏈接

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容