【说站】python数据变换如何实现
2024-12-18
45
python数据变换如何实现
1、数据规范化,即归一化的方法
常见方法:最小-规范化、z-score规范化、小数定标规范化
import pandas as pd df=pd.DataFrame(A.data[:,3:6]) df.columns=A.feature_names[3:6] #最小-规范化,支持矢量运算 (df-df.min())/(df.max()-df.min()) #使用sklearn中的preprocessing模块 from sklearn import preprocessing preprocessing.minmax_scale(df) #z-score规范化:结果=(数值-均值)/标准差,处理后数据的均值为0,标准差为1 (df-df.mean())/df.std() #使用sklearn中的preprocessing模块 from sklearn import preprocessing preprocessing.scale(df) #小数定标规范化:常见落在[-1,1]区间,通过移动小数点的位数实现,移动位数取决于属性绝对值的值的位数 #ceil向上取整 import numpy as np df/10**np.ceil(np.log10(df.abs().max()))
2、连续属性离散化
常见方法:分箱法(等宽法、等频法)、聚类
import pandas as pd #等宽法,5个箱子,标签为0-4 pd.cut(df.AGE,5,label=range(5)) #等频法 pd.qcut(df.AGE,5,label=range(5))
以上就是python数据变换的实现,希望对大家有所帮助。更多Python学习指路:python基础教程
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
更新于:1个月前赞一波!4
相关文章
- 【说站】python自定义日志如何实现
- 【说站】python有哪些注释的种类
- 【说站】python中__new__的重写
- 【说站】python如何解决初始化执行次数
- 【说站】python错误类型捕获的方法
- 【说站】python数据结构堆的介绍
- 【说站】python参数调用的注意点
- 【说站】mysql多表查询如何实现
- 【说站】js如何实现类型判断
- 【说站】python Pandas读取数据文件的优点
- 【说站】python中in和is的区分
- 【说站】python异常中常见关键字
- 【说站】mysql有哪些数据操作
- 【说站】python os.path.join()函数的使用
- 【说站】python如何使用skimage包提取图像
- 【说站】python confusion_matrix()是什么
- 【说站】python中os.path.join()函数是什么
- 【说站】python中有哪些比较操作
- 【说站】python字符串的用法总结
- 【说站】php方法断点如何实现
文章评论
评论问答