首先生成一个带有缺失值的表
data = pd.DataFrame({'A':[1,2,None],"B":[4,None,6],'C':[None,8,9]})
缺失值查看
使用isna()或Isnull()函数,会有在有缺失的位置上显示True;也可以使用.isna().any(),有缺失值列将会返回True
data.isna()
缺失值删除
使用dropna()函数。该函数默认删除含有缺失值的行,运行后返回删除后的数据。如果要删除空白行,只要传入一个参数how=’all’即可;如果要删除指定列位置有缺失值的行,可以传入subset=[‘column name1’, ‘column name2’]。例如,删除A列和C列有缺失值的行。
data.dropna(subset=['A','C'])
缺失值填充
使用fillna()函数,在括号中输入要填充的值即可。如果要对指定列进行填充,需要在括号中指定列名。例如,只对A列和C列缺失值进行填充。
data.fillna({'A':3.0,'C':7.0})