数据预处理—缺失值处理

首先生成一个带有缺失值的表

data = pd.DataFrame({'A':[1,2,None],"B":[4,None,6],'C':[None,8,9]})

QQ图片20200627084701.png

缺失值查看

使用isna()或Isnull()函数,会有在有缺失的位置上显示True;也可以使用.isna().any(),有缺失值列将会返回True

data.isna()

QQ图片20200627084957.png

缺失值删除

使用dropna()函数。该函数默认删除含有缺失值的行,运行后返回删除后的数据。如果要删除空白行,只要传入一个参数how=’all’即可;如果要删除指定列位置有缺失值的行,可以传入subset=[‘column name1’, ‘column name2’]。例如,删除A列和C列有缺失值的行。

data.dropna(subset=['A','C'])

QQ图片20200627085534.png

缺失值填充

使用fillna()函数,在括号中输入要填充的值即可。如果要对指定列进行填充,需要在括号中指定列名。例如,只对A列和C列缺失值进行填充。

data.fillna({'A':3.0,'C':7.0})

QQ图片20200627085945.png

赞(0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权,转载请注明出处。
文章名称:《数据预处理—缺失值处理》
文章来自:泰恩数据
文章链接:https://tyne.cc/841.html
本站资源仅供个人学习使用,请勿用于商业用途。

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址