0.摘要

pandas中fillna()方法,能够使用指定的方法填充NA/NaN值。

1.函数详解

函数形式:fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

参数:

value:用于填充的空值的值。

method: {'backfill', 'bfill', 'pad', 'ffill', None}, default None。定义了填充空值的方法, pad / ffill表示用前面行/列的值,填充当前行/列的空值, backfill / bfill表示用后面行/列的值,填充当前行/列的空值。

axis:轴。0或'index',表示按行删除;1或'columns',表示按列删除。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

limit:int, default None。如果method被指定,对于连续的空值,这段连续区域,最多填充前 limit 个空值(如果存在多段连续区域,每段最多填充前 limit 个空值)。如果method未被指定, 在该axis下,最多填充前 limit 个空值(不论空值连续区间是否间断)

downcast:dict, default is None,字典中的项为,为类型向下转换规则。或者为字符串“infer”,此时会在合适的等价类型之间进行向下转换,比如float64 to int64 if possible。

2.示例

import numpy as np
import pandas as pd
 
a = np.arange(100,dtype=float).reshape((10,10))
for i in range(len(a)):
    a[i,:i] = np.nan
a[6,0] = 100.0
 
d = pd.DataFrame(data=a)

# 用0填补空值
print(d.fillna(value=0))

# 用前一行的值填补空值
print(d.fillna(method='pad',axis=0))


# 用后一列的值填补空值
print(d.fillna(method='backfill', axis=1))

# 连续空值,最多填补3个
print(d.fillna(method='ffill',axis=0, limit=3))

# 每条轴上,最多填补3个
print(d.fillna(value=-1,axis=0, limit=3))