pandas学习(二)数据的引用和缺失值处理,重复值处理
创始人
2025-05-29 08:08:44
0

数据的引用

语法说明
df[label]指定DataFrame对象的列标签并选择列
df[[label1,label2]]指定DataFrame对象的多个列标签并选择多个列
df[loc:loc]指定DataFrame行位置索引并选择行,终止元素不选择
df.loc[label]指定DataFrame行索引并选择行,类似df.loc[label,:]
df.loc[:,lable选择DaaFrame对象的列标签并选择对应列
df.loc[label1,label2]指定DataFrame的行标签和列标签,并选择元素
df.iloc[loc]选择DataFrame行位置索引,与df.iloc[loc:]等同
df.iloc[[loc1,loc2]]指定DataFrame多个行位置索引进行选择
df.iloc[:,loc]指定DataFrame的列位置索引进行选择
df.iloc[loc1,loc2指定DataFrame的行位置索引和列位置索引进行选择

在这里插入图片描述

缺失值

在处理缺失值过程中,需要注意NAN不能使用==进行比较,这与python中的None存在不同,在python中,None可以使用None进行比较的。
A
在这里插入图片描述
在处理包含缺失值计算过程中,NAN是可以传播的,传播的意思表示只要包含一个NAN,运算结果也会是NAN。
在这里插入图片描述

缺失值的确认

DataFrame.isnull()
DataFrame.isna()
DataFrame.notna()
DataFrame.dropna(axis,how,thresh,subset,inplace)pandas.isna()
pandas.isnull()
pandas.notna()

isnull,isna,notna,都是用于判断是否存在NAN,在使用isnull,isna方法时,方法会对缺失值位置返回True,其他位置返回False,notna则相反
dropna是返回删除缺失值行后的结果,
在这里插入图片描述

缺失值的填充

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
  • value: 变量、字典、Series,DataFrame;用于填充填充缺失值,或指定为每个索引(对于Series)或列(对于DataFrame)的缺失值使用字典/Series/DataFrame的值填充
  • method: {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, 默认None, pad/ffill表示向后填充空值,backfill/bfill表示向前填充空值
  • axis: {0 or ‘index’, 1 or ‘columns’}
  • inplace: boolean, 默认为False。若为True, 在原地填满
  • limit: int, 默认为None, 如果指定了方法, 则这是连续的NaN值的前向/后向填充的最大数量
  • downcast: dict, 默认None, 字典中的项为类型向下转换规则。

在这里插入图片描述

重复值处理

重复行检测

DataFrame.duplicated(subset,keep)
  • subset:检测重复的数据范围。默认为数据集的所有列,可指定特定数据列
  • keep: 标记哪个重复数据,默认为‘first’。1.‘first’:标记重复数据第一次出现为True;‘last’:标记重复数据最后一次出现为True;False:标记所有重复数据为True。

在这里插入图片描述

删除重复行

DataFrane,drop_duplcates(subset,keep,inplace,ignore_index)
  • subset:column label or sequence of labels, optional,需要删除的列,默认是全部的列
  • keep:{‘first’, ‘last’, False}, default,‘first’,确定要保留的重复项(如果有),first和last分别是第一次和最后一次,false则是删除所有的重复项
  • inplace:bool, default False,是否覆盖原来的df
  • ignore_index:bool, default False
    在这里插入图片描述

相关内容

热门资讯

arcpy基础篇(2)-访问空... 1.检查数据的存在性 在Python脚本中,可以使用Exists函数来检查当前工作空间...
幼儿园毕业典礼活动方案 关于幼儿园毕业典礼活动方案(通用10篇)  为有力保证事情或工作开展的水平质量,常常需要预先准备方案...
消防应急培训演练方案 消防应急培训演练方案  为了确保工作或事情顺利进行,通常需要预先制定一份完整的方案,方案是综合考量事...
同学聚会活动方案 同学聚会活动方案(精选15篇)  为了确保工作或事情能高效地开展,预先制定方案是必不可少的,方案的内...
国务院关于职工工作时间的规定 (1994年2月3日中华人民共和国国务院令第146号发布 根据1995年3月25日《国...
部门团建活动方案 部门团建活动方案(2篇)  为了确保事情或工作得以顺利进行,常常需要预先制定方案,方案指的是为某一次...
C语言函数:判断字符函数,判断... iscntrl:判断是否是控制字符isspace:判断是否是空白字符...这些函数的参数都是一个字符...
内核实验(八):实现O-NON... 一、篇头 继续使用qemu调试内核的实验。本章复习阻塞与非阻塞IO的概念和机制,然后对...
门店运营计划书 门店运营计划书(通用8篇)  光阴迅速,一眨眼就过去了,又迎来了一个全新的起点,此时此刻我们需要开始...
JavaWeb——Idea模板... Idea模板创建Servlet 第一步  第二步  第三步  此处的Servlet模板也可以定...
综合实践活动方案 综合实践活动方案(通用23篇)  为了确保工作或事情有序地进行,往往需要预先制定好方案,方案是从目的...
青少年体能训练计划方案 青少年体能训练计划方案  青少年体能训练计划方案(通用10篇)  为有力保证事情或工作开展的水平质量...
全国爱牙日活动方案   2014年9月20日是我国第二十四个全国“爱牙日”,为发挥家庭的优势和作用,提高家庭成员口腔保健...
第5讲 cameraserve... 本讲是Android Camera Native Framework专题的第5讲,我们...
11-STM32F1 -DMA... 11-STM32F1 -DMA(1) DMA:Data Memory A...
促销活动方案 实用的促销活动方案集锦9篇  为了确保工作或事情有序地进行,常常需要预先制定方案,方案是书面计划,是...
清明节主题党日活动方案 清明节主题党日活动方案(通用7篇)  为了确保活动有序有效开展,我们需要事先制定活动方案,活动方案是...
施工现场扬尘专项防治方案 施工现场扬尘专项防治方案  什么是方案  方案是从目的、要求、方式、方法、进度等都部署具体、周密,并...
家电促销活动方案 家电促销活动方案通用15篇  为保证事情或工作高起点、高质量、高水平开展,往往需要预先进行方案制定工...
考研408每周一题(2019 ... 2019年(单链表)         41.(13分)设线性表L=(a1,a2...