pandas

Pandas.DataFrame删除指定行和列(drop)的实现

目录 DataFrame指定的行删除 按行名指定(行标签) 按行号指定 未设置行名的注意事项 DataFrame指定的列删除 按列名指定(列标签) 按列号指定 多行多列的删除 使用drop()方法删除pandas.DataFrame的行和列。 在0.21.0版之前,请使用参数labe »

Pandas多个条件(AND,OR,NOT)中提取行

目录 如何提取(选择)行 通过AND,OR,NOT多个条件提取(选择)行的代码-示例 3个以上条件的运算符的优先级 使用Pandas从多个条件(AND,OR,NOT)中提取行的方法。 有以下2点需要注意: &,|,〜的使用(and、or、not的错误) 使用比较运算符时,请将每个条件括在 »

Pandas提取含有指定字符串的行(完全匹配,部分匹配)

目录 行的提取(选择)方法 完全匹配 == 部分匹配 str.contains():包含一个特定的字符串 参数na:缺少值NaN处理 参数case:大小写我的处理 参数regex:使用正则表达式模式 str.endswith():以特定字符串结尾 str.startswith():以特定的 »

pandas.DataFrame的for循环迭代的实现

目录 pandas.DataFrame for循环的应用 逐列检索 DataFrame.iteritems() 逐行检索 DataFrame.iterrows() DataFrame.itertuples() 检索特定列的值 循环更新值 当使用for语句循环(迭代)pandas.Dat »

Pandas中map(),applymap(),apply()函数的使用方法

目录 指定pandas对象作为NumPy函数的参数 元素的应用 行/列的应用 pandas.DataFrame,pandas.Series方法 Pandas对象方法的函数应用 适用于Series的每个元素:map(),apply() 应用于DataFrame的每个元素:applymap() »

Pandas.concat连接DataFrame,Series的示例代码

目录 如何使用pandas.concat()函数连接pandas.DataFrame和pandas.Series。 将对以下内容进行说明。 pandas.concat的基本用法()指定要连接的对象:objs连接方向的指定(垂直/水平):axis指定连接方法(外部连接/内部连接):joinpa »

Pandas中DataFrame对象转置(交换行列)

DataFrame对象本质上是带有行列索引的二维矩阵,所以欲对DataFrame对象进行转置操作,需要交换行列索引,同时使二维矩阵转置。 首先创建一个DataFrame对象  import pandas as pd list_test = [[1,2,3],[4,5,6],[7,8,9]] »

pandas中groupby操作实现

目录 一、实验目的 二、实验原理 三、实验环境 四、实验内容 五、实验步骤 一、实验目的 熟练掌握pandas中的groupby操作 二、实验原理 groupby(by=None, axis=0, level=None, as_index=True, sort=True, group »

pandas检查和填充缺失值的N种方法总结

目录 一、构建示例数据 二、检查缺失值的n种方法 2.1 确认是否有缺失值的两种方法 2.2 查看缺失数目和缺失率 2.3 查看非缺失值数目 三、缺失值填充三种示例 一、构建示例数据 import pandas as pd import numpy as np data = {" »

pandas预处理部分地区数据案例

数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 数据清洗主要是处理缺失数据、重复数据 »

pandas数据聚合与分组运算的实现

数据聚合与分组运算 对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准备好之后,通常就是计算分组统计或生成透视表。pandas提供了一个灵活高效的gruopby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。 关 »

Pandas检查dataFrame中的NaN实现

目录 检查Pandas DataFrame中的NaN值 方法1:使用isnull().values.any()方法 方法2:使用isnull().sum()方法 方法3:使用isnull().sum().any()方法 方法4:使用isnull().sum().sum()方法 参考 NaN代表 »

pandas将Series转成DataFrame的实现

目录 1.Series结构 2.将Series转成DataFrame 2.1 使用字典的方式转化 2.2 使用reset_index方法 3.apply,applymap, map 1.Series结构 pandas中,我们使用最多的两个数据结构,分别为Series与DataFram »

pandas中fillna()函数填充NaN和None的实现

填充缺失值和空值的方式有很多种,比如人工填写、热卡填充等,Pandas中的fillna()方法可以实现填充空值或缺失值。 fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, ** »

Pandas出现KeyError的问题解决及分析

目录 写在前面 报错详细信息 问题解决 举一反三 写在前面 今天在用爬虫及Pandas更新股票日线数据的时候发现KeyError报错,后面跟了一个DataFrame列索引,一开始以为是索引修改列的值导致的问题,修改为.loc错误依然出现,后来将列值的内容修改方法改为.apply(lambd »

Pandas中字符串和时间转换与格式化的实现

目录 把字符串转为时间格式 把时间格式化为字符串 格式化某一列的时间为字符串 遇到的错误 使用apply()和lambda函数 Pandas 提供了若干个函数来格式化时间。 把字符串转为时间格式 其中,最常用的是 to_datetime() 函数。 可以使用 to_datetime() »

pandas按某列降序的实现

升序 import pandas as pd import numpy as np data = np.random.randint(low=2,high=10,size=(5,3)) data2 = np.random.randint(low=2,high=10,size=(5,3)) »

Pandas数据分析常用函数的使用

目录 一、数据导入导出 二、数据加工处理 三、列表格式设置 Pandas是数据处理和分析过程中常用的Python包,提供了大量能使我们快速便捷地处理数据的函数和方法,在此主要整理数据分析过程pandas包常用函数,以便查询。更多函数学习详见padans官网 一、数据导入导出 pandas »