Python如何进行预处理操作?Python数据预处理常用的3个技巧

我们知道数据是一项宝贵的资产,原始数据通常不能立即使用,它需要进行大量清理和转换 。Pandas 是 Python 的数据分析和操作库,它有多种清理数据的方法和函数 。在本文中,给大家分享这篇关于“Python如何进行预处理操作?Python数据预处理常用的3个技巧” 来帮助大家掌握数据清理技能 。一起来学习了解吧 。

Python如何进行预处理操作?Python数据预处理常用的3个技巧


假设我现在有一个数据集
num      date    name    payment    note0    08/01/2022    jieDA    $10.0    Nan1    2022-08-05    XIAOhU    $20.2    Neutrl2    April 3th,2022    wangWang    $100    NaN【Python如何进行预处理操作?Python数据预处理常用的3个技巧】其中包括了一些我不需要的数据存在,比如第一列是多余的我想删除,还有对一个dade日期的定义没有一定是使用标准,表中存在着name值,但是没有对名字的大小写进行区分,在表中还有一个payment数量的存在,本应该是一个整型数据,可是以字符串的形式出现..这些内容就是我们今天要处理的,一起来看看具体实例吧 。
示例1:删除多余的列
对一个列的删除是我们使用drop函数的基本操作,在drop函数中我们不仅要指定一个坐标轴参数的值,还需要使用inplace来对参数进行一个保存 。代码如下:
import pandas as pddf.drop("Unnamed: 0", axis=1, inplace=True)示例2:日期转换
在日期中我们可以实现多种转换,可以根据自己的需求进行适当的格式转换操作,简单的方法是使用astype函数来对数据类型更改列的操作,它能将日期转换变得整洁且按照标准的日期格式,代码如下:
df["date"] = df["date"].astype("datetime64[ns]")运行结果:
date            name    payment    note2022-08-01    jieDA    $10.0    Nan2022-08-05    XIAOhU    $20.2    Neutrl2022-04-03    wangWang    $100    NaN示例3:名称列
对名称列的改变,我们需要考虑几个问题是使用所有大写或小写字母来表示它们还是只对开头字母进行大写操作 。
对姓氏和名称切换
df["Name"].str.split(",", expand=True)关于Python如何进行预处理操作?Python数据预处理常用的3个技巧的内容就讲解到这里了,希望以上内容对你有所帮助 。

    猜你喜欢