Pandas

Pandas技术分享

loc函数和at函数的区别

阅读(393)

loc函数和at函数都可以定位pandas表格元素值。主要区别在于: loc函数可以筛选多个位置的元素,at函数用于筛选特定位置的元素。 loc函数赋值时不能赋值列表,at函数可以。

Pandas中的逻辑非

阅读(627)

Pandas中用符号 ~ (键盘左上角)表示逻辑非,对逻辑语句取反。 在Python基本语法中,使用 not 表示逻辑非,但是Pandas中只能用 ~ ,不能用not。 Python中的逻辑运算关键字(and,or,not)除了可以连接布尔...

Pandas修改指定列名的几种方法

阅读(2597)

Pandas修改列名总是需要生成一个新列名序列,然后再将列名指向新列名序列。 生成一个表 data = pd.DataFrame({'A':[1,2,3,4,2],"D":[4,5,6,7,5],'C':[7,8,9,3,8]}) 这里要把...

数据预处理—重复值处理-泰恩数据

数据预处理—重复值处理

阅读(711)

重复数据就是同样记录有多条,一般做删除处理。 首先生成一个包含重复数据的表 data = pd.DataFrame({'A':[1,2,3,4,2,5,4],"B":[4,5,6,7,5,8,7],'C':[7,8,9,3,8,9,3]})...

数据预处理—缺失值处理-泰恩数据

数据预处理—缺失值处理

阅读(599)

首先生成一个带有缺失值的表 data = pd.DataFrame({'A':[1,2,None],"B":[4,None,6],'C':[None,8,9]}) 缺失值查看 使用isna()或Isnull()函数,会有在有缺失的位置上显示...

Pandas唯一值获取和重复值处理

阅读(708)

pandas获取唯一值的方法: unique() df['column_name'].unique() 查找和删除重复值的方法: duplicated() drop_duplicates() df['column_name'].duplic...

pandas中的isin函数详解

阅读(759)

今天有个同学问到,not in 的逻辑,想用 SQL 的select c_xxx_s from t1 left join t2 on t1.key=t2.key where t2.key is NULL 在 Python 中的逻辑来实现,实...

Pandas数据透视表

阅读(529)

数据透视表是一个非常实用的功能,可以pandas的pivot_table()来实现。 pd.pivot_table(df, index='客户分类', columns='区域',values=['用户ID','7月销量'], aggfunc...