pandas.replace 的使用
1. pandas.replace()介绍
Series.replace(to_replace=None, value=NoDefault.no_default, inplace=False, limit=None, regex=False, method=NoDefault.no_default)
Example
2. 单值替换
2.1 全局替换
df.replace(1, 10)
2.2 选定条件替换
df['attr_1'].replace('场景.季节.冬天', '冬天', inplace=True)
3. 多值替换
3.1 多个值替换同一个值
df.replace([3, 11, 137], 4)
3.2 多个值替换不同值
df.replace([3, 11, 137, 1], [1, 111, 731, 10])
# 修改不同列
df.replace({'场景.普通运动.跑步':'跑步', 11:100})
# 修改同一列
df.replace({'attr_1':{'场景.普通运动.跑步':'跑步', '场景.户外休闲.爬山':'爬山'}})
4. 模糊查询替换
df.replace('场景.','', regex=True)
df.replace(regex='场景.', value=' ')
df.replace(regex={'场景.': '', '方案.':''})
df.replace(regex=['场景.', '方案.'], value='')
也可以这样
df['Attr_B'] = df['Attr_B'].str.replace('夹克', '大衣')
df
5. 缺失值替换
5.1 method的用法 (向前/后填充)
Example
s.replace(np.nan, method='pad')
s.replace(np.nan, method='ffill')
s.replace(np.nan, method='bfill')
5.2 limit的用法 (限制最大填充间隔)
连着多个空值时,limit为几填充几个
Example
s.replace(np.nan, method='ffill', limit=1)
s.replace(np.nan, method='ffill', limit=2)