PYTHON数据归一、标准化以及排名
发布网友
发布时间:2024-10-02 08:14
我来回答
共1个回答
热心网友
时间:2024-10-27 22:05
前言:
本文是对学习Python数据处理时归一化与标准化方法的补充和总结。
1、归一化与标准化方法
归一化与标准化是数据处理中的常见操作。归一化方法将数据范围调整至特定区间,如[0,1],常用公式为:(x - min) / (max - min)。标准化方法则通过减去平均值并除以标准差,将数据转换为均值为0,标准差为1的分布,公式为:(x - mean) / std。
核心代码示例如下:
归一化核心代码:df2=df.apply(lambda x: (x - np.min(x)) / (np.max(x) - np.min(x)))
标准化核心代码:df2 = df.apply(lambda x: (x - np.mean(x)) / (np.std(x)))
2、数据排名
数据排名功能可通过Dataframe.rank函数实现,参数可调整为升序或降序,以及是否以百分比形式显示排名。
3、下步计划
1. 课题报告研究:计划对不同企业使用SVM或机器学习算法进行分组研究。已掌握R语言,计划五一期间用Python实现代码示例并更新专栏。
2. 毕业论文研究:计划研究上市公司股利*,涉及约3000家A股公司,时间跨度15-20年,需处理数据量大,计划五一期间测试数据获取与处理。
3. 爬虫学习:关注大佬爬虫教程,计划五一期间跟随学习。
总结与后记:本文对归一化、标准化方法及数据排名进行了总结,提及了下步学习与研究计划,提供了代码示例和相关网站链接。欢迎提供反馈以提升学习效果。