前言
我嘗試給pandas中篩選后數(shù)據(jù)的某行某列賦值時,提示SettingWithCopyWarning:,是說不能直接對副本進行數(shù)據(jù)修改。
問題復(fù)現(xiàn)
原始數(shù)據(jù)

image.png
此處
year-month-day為簽到日期,diff是我想計算的連續(xù)簽到天數(shù),如果下一行減去本行為1,則計為連續(xù)簽到天數(shù),diff的值+1。
我原來的賦值方法:
df.loc[df['user_id'] == i,'diff'].iloc[j] = 1# 報錯,其中i為第i個user_id的值,j為同一user_id的第j行
這里我通過df.loc[df[xx]==i,'yy'].iloc[j] = zz賦值(xx、yy均為列名),其中df.loc[df[xx]==i]后直接賦值是可以的,df.loc[df[xx]==i]為df的一個子集,即view或視圖,而df.loc[df[xx]==i,'yy'].iloc[j]為df的一個副本,是不能直接賦值的(但是可以print查看)。
處理方法(供參考,不適用所有場景)
我的處理方法比較傻:先把df.loc[df[xx]==i].copy()賦給一個臨時變量dfx,然后dfx.iloc[j,dfx.columns.get_loc('yy')] = zz計算完后再把臨時變量賦值回原df,即df.loc[df[xx]==i,'yy'] = dfx['yy']。
處理后的結(jié)果:

image.png
總結(jié)(不想看前面廢話請看這里:)
1,建議只使用一個loc或一個iloc方法賦值,即df.loc[xx]=zz或df.iloc[xx]=zz;不能同時使用loc和iloc賦值,即df.loc[xx].iloc[yy]=zz。
2,如果想實現(xiàn)1中同時使用loc和iloc后進行賦值,可先用臨時變量存loc的值,再對臨時變量進行iloc的運算,處理后再賦值回原變量