我们知道数据是一项宝贵的资产,原始数据通常不能立即使用,它需要进行大量清理和转换 。Pandas 是 Python 的数据分析和操作库,它有多种清理数据的方法和函数 。在本文中,给大家分享这篇关于“Python如何进行预处理操作?Python数据预处理常用的3个技巧” 来帮助大家掌握数据清理技能 。一起来学习了解吧 。

假设我现在有一个数据集
num date name payment note0 08/01/2022 jieDA $10.0 Nan1 2022-08-05 XIAOhU $20.2 Neutrl2 April 3th,2022 wangWang $100 NaN【Python如何进行预处理操作?Python数据预处理常用的3个技巧】其中包括了一些我不需要的数据存在,比如第一列是多余的我想删除,还有对一个dade日期的定义没有一定是使用标准,表中存在着name值,但是没有对名字的大小写进行区分,在表中还有一个payment数量的存在,本应该是一个整型数据,可是以字符串的形式出现..这些内容就是我们今天要处理的,一起来看看具体实例吧 。
示例1:删除多余的列
对一个列的删除是我们使用drop函数的基本操作,在drop函数中我们不仅要指定一个坐标轴参数的值,还需要使用inplace来对参数进行一个保存 。代码如下:
import pandas as pddf.drop("Unnamed: 0", axis=1, inplace=True)示例2:日期转换
在日期中我们可以实现多种转换,可以根据自己的需求进行适当的格式转换操作,简单的方法是使用astype函数来对数据类型更改列的操作,它能将日期转换变得整洁且按照标准的日期格式,代码如下:
df["date"] = df["date"].astype("datetime64[ns]")运行结果:
date name payment note2022-08-01 jieDA $10.0 Nan2022-08-05 XIAOhU $20.2 Neutrl2022-04-03 wangWang $100 NaN示例3:名称列
对名称列的改变,我们需要考虑几个问题是使用所有大写或小写字母来表示它们还是只对开头字母进行大写操作 。
对姓氏和名称切换
df["Name"].str.split(",", expand=True)关于Python如何进行预处理操作?Python数据预处理常用的3个技巧的内容就讲解到这里了,希望以上内容对你有所帮助 。
猜你喜欢
- python中创建表格的两种方法 python库创建表格的实例
- Python如何去掉字符串左边的空格?python去掉空格的一些常用方式?
- 淘宝补大单能提高转化吗?如何有效淘宝补单?
- 天猫供销平台入驻类目如何修改?怎么更改主营业务?
- 精选 形容对自己的过失进行反省或反思的成语
- 淘宝客服如何提高个人业绩?怎么做?
- 淘宝直播如何增加人气?方法是什么?
- 淘宝成交转化率多少为最好?如何提高转化率?
- 淘宝金冠店铺是指什么?如何成为金冠店铺?
- 淘宝金冠和银冠有什么区别?如何升级银冠?
