解決: 'DeepSpeedCPUAdam' object has no attribute 'ds_opt_adam'

deepspeed運(yùn)行大模型時(shí)報(bào)錯(cuò):

```python

Exception ignored in: <function DeepSpeedCPUAdam.__del__ at 0x7f4892b5a020>

Traceback (most recent call last):

? File "/home/conda/envs/dsp/lib/python3.10/site-packages/deepspeed/ops/adam/cpu_adam.py", line 102, in __del__

? ? self.ds_opt_adam.destroy_adam(self.opt_id)

AttributeError: 'DeepSpeedCPUAdam' object has no attribute 'ds_opt_adam'

Exception ignored in: <function DeepSpeedCPUAdam.__del__ at 0x7f7692a2e020>

Traceback (most recent call last):

? File "/home/conda/envs/dsp/lib/python3.10/site-packages/deepspeed/ops/adam/cpu_adam.py", line 102, in __del__

? ? self.ds_opt_adam.destroy_adam(self.opt_id)

AttributeError: 'DeepSpeedCPUAdam' object has no attribute 'ds_opt_adam'

```

解決路徑:

1. 在命令行輸入

python -c 'import deepspeed; deepspeed.ops.adam.cpu_adam.CPUAdamBuilder().load()'

進(jìn)行錯(cuò)誤復(fù)現(xiàn),查看是否會(huì)報(bào)錯(cuò),如果是torch和cuda版本不匹配,會(huì)報(bào)錯(cuò):

deepspeed.ops.op_builder.CUDAMismatchException: xxxx

2. 解決方案(兩種)

? ? a. 在執(zhí)行代碼前加:DS_SKIP_CUDA_CHCK=1

? ? b. 直接進(jìn)去錯(cuò)誤源碼中,改為不校驗(yàn)torch,cuda版本匹配問(wèn)題

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容