数据分析 第3页

数据分析

标准化和归一化的区别

阅读(1075)

标准化和归一化,请勿混为一谈,透彻理解数据变换 数据处理中的归一化、标准化(Standardization)、中心化和正则化(Normalization)区别详解 标准化和归一化的区别

线性不可分分类的实现-泰恩数据

线性不可分分类的实现

阅读(858)

使用逻辑回归可以处理线性不可分分类问题。和线性可分相比,引入多项式会使决策边界变得弯曲,从而实现非线性分类。 读入数据 train=np.loadtxt('./data3.csv',delimiter=',',skiprows=1) tra...

pandas中的isin函数详解

阅读(1020)

今天有个同学问到,not in 的逻辑,想用 SQL 的select c_xxx_s from t1 left join t2 on t1.key=t2.key where t2.key is NULL 在 Python 中的逻辑来实现,实...

Pandas数据透视表

阅读(724)

数据透视表是一个非常实用的功能,可以pandas的pivot_table()来实现。 pd.pivot_table(df, index='客户分类', columns='区域',values=['用户ID','7月销量'], aggfunc...

pandas修改列名

阅读(1131)

可以直接修改: df.columns = ['a','b','c','d'] 缺点是每一列的名称都要写出来。 还是用rename比较方便: df.rename(columns={'A':'a','C':'c'},inplace=True) ...

pandas处理丢失数据

阅读(890)

df.iloc[1,3]=np.nan #给指定位置定义空值 df.iloc[3,1]=np.nan del df['e'] #删除指定行 print(df) print(df.dropna(axis=0,how='any')) # axi...

用 scipy.optimize.linprog 实现线性规划-泰恩数据

用 scipy.optimize.linprog 实现线性规划

阅读(1299)

1 概述 线性规划:在线性等式和不等式约束下最小化线性目标函数。 线性编程可解决以下形式的问题: $$min{\quad}c^Tx $$ $$ \begin{aligned} {s.t.}{\quad}A_{ub}x≤b_{ub}...

Pandas crosstab()和div()函数的使用-泰恩数据

Pandas crosstab()和div()函数的使用

阅读(1490)

本文介绍Pandas crosstab()和div()函数的用法。从Tushare获取股票的收盘价数据,计算每日收益率,接着判断每周各天涨跌的概率。 从Tushare中获取股票的收盘价,并做各种数据整理。 import numpy as n...