array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>python--Numpy and Pandas 基本语法 - 爱码网</title>
     
<meta name="keywords" content="python,numpy,pandas python" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-16706.html" title="python--Numpy and Pandas 基本语法">python--Numpy and Pandas 基本语法</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc"> yudanqu 
                <time class="post-date" datetime="2018-05-04">2018-05-04</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<!--done-->
<div id="topics">
	<div class="post">
		
		
		<div class="postBody">
			<div id="likecs_post_body" class="blogpost-body">
<p>　　<strong><span style="font-family: 楷体; font-size: 18px">numpy和pandas是python进行数据分析的非常简洁方便的工具，话不多说，下面先简单介绍一些关于他们入门的一些知识。下面我尽量通过一些简单的代码来解释一下他们该怎么使用。以下内容并不是系统的知识体系，我只是尽可能把最基础的知识点列写一下。</span></strong></p>
<p> </p>
<p> </p>
<p> </p>
<p><span style="font-size: 18pt"><strong>一、numpy</strong></span><br><span style="font-size: 14pt">1、array</span></p>
<div class="likecs_code">
<pre>1 <span style="color: #0000ff">import</span><span style="color: #000000"> numpy
</span>2 list_1 = [1,2,3,4<span style="color: #000000">]
</span>3 array_1 = numpy.array(list_1) <span style="color: #008000">#</span><span style="color: #008000"> 一维数组</span>
4 list_2 = [4,5,6,7<span style="color: #000000">]
</span>5 array_2 = numpy.array([list_1,list_2]) <span style="color: #008000">#</span><span style="color: #008000"> 二维数组</span></pre>
</div>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> array_2.shape <span style="color: #008000">#</span><span style="color: #008000"> 查看数组特征，eg：2行4列</span>
<span style="color: #008080">2</span> array_2.size <span style="color: #008000">#</span><span style="color: #008000"> 查看元素个数, eg:8</span>
<span style="color: #008080">3</span> array_2.dtype <span style="color: #008000">#</span><span style="color: #008000"> 查看数组类型，eg：int64</span></pre>
</div>
<p><span style="text-decoration: underline">注：numpy.arange(n) #与python中的range区别是前面有个a</span></p>
<p> </p>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> numpy.zeros(s) <span style="color: #008000">#</span><span style="color: #008000"> 全0矩阵，s可以为一个数也可以为一个列表，eg：[2,3]表示2*3的二维数组</span>
<span style="color: #008080">2</span> numpy.eye(a) <span style="color: #008000">#</span><span style="color: #008000"> 单位矩阵，生成的是浮点数</span></pre>
</div>
<p> </p>
<ul>
<li>访问数组中元素：</li>
</ul>
<p> 　　一维：array_1[2] 、array_1[1:4]<br>			　　二维：array_2[1][2] 、array_2[1,2] 、array_2[:1,1:4]</p>
<p>　　其中可以根据python中列表的切片来访问数据</p>
<p><span style="font-size: 14pt">	2、数组与矩阵运算</span></p>
<p><span style="font-size: 18px">~~数组array</span></p>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> numpy.random.randn(10) <span style="color: #008000"># </span><span style="color: #008000">十个元素的一维数组</span>
<span style="color: #008080">2</span> numpy.random.randint(10,size=20).reshape(4,5) <span style="color: #008000"># </span><span style="color: #008000">产生20个10以内的随机整数，后面的reshape是将这些数重新写成一个4*5的二维数组</span></pre>
</div>
<ul>
<li>数组之间维度相同可以直接进行加减乘除（除数不能为0）</li>
<li>numpy.unique(array_1) # 找到里面所有的数但不重复</li>
<li>sum:二维数组中对每一列求和 sum(array_2)
<ul>
<li>sum(array_2[0) 对第一行求和</li>
<li>sum(array_2[:,0] 对第一列求和</li>
</ul>
</li>
<li>array_2.max() #求最大值，对某行某列求则同sum</li>
</ul>
<p><span style="font-size: 18px">~~矩阵matric</span></p>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> numpy.mat([1,2,3],[4,5,6]) <span style="color: #008000">#</span><span style="color: #008000"> 生成一个二维矩阵</span>
<span style="color: #008080">2</span> numpy.mat(array_1) <span style="color: #008000">#</span><span style="color: #008000"> 将数组转换成矩阵</span></pre>
</div>
<p><span style="text-decoration: underline">注：矩阵之间维度相同可以直接进行加减运算，而乘除运算需要行和列交叉对应，参照线性代数中的知识。</span></p>
<h3>3、input和output:</h3>
<div class="likecs_code">
<pre><span style="color: #008080"> 1</span> <span style="color: #0000ff">import</span><span style="color: #000000"> numpy as np 
</span><span style="color: #008080"> 2</span> f = open(<span style="color: #800000">'</span><span style="color: #800000">x.pkl</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">wb</span><span style="color: #800000">'</span><span style="color: #000000">)
</span><span style="color: #008080"> 3</span> <span style="color: #008000">#</span><span style="color: #008000">序列化到硬盘</span>
<span style="color: #008080"> 4</span> 
<span style="color: #008080"> 5</span> <span style="color: #008000">#</span><span style="color: #008000">pickle</span>
<span style="color: #008080"> 6</span> <span style="color: #0000ff">import</span><span style="color: #000000"> pickle
</span><span style="color: #008080"> 7</span> pickle.dump(x,f) <span style="color: #008000">#</span><span style="color: #008000"> 产生pkl文件</span>
<span style="color: #008080"> 8</span> pickle.load(f) <span style="color: #008000">#</span><span style="color: #008000"> 提取pkl文件</span>
<span style="color: #008080"> 9</span> 
<span style="color: #008080">10</span> <span style="color: #008000">#</span><span style="color: #008000">numpy本身的工具</span>
<span style="color: #008080">11</span> numpy.save(<span style="color: #800000">'</span><span style="color: #800000">one_array</span><span style="color: #800000">'</span><span style="color: #000000">,x)
</span><span style="color: #008080">12</span> numpy.load(<span style="color: #800000">'</span><span style="color: #800000">one_array.npy</span><span style="color: #800000">'</span><span style="color: #000000">)
</span><span style="color: #008080">13</span> numpy.savez(<span style="color: #800000">'</span><span style="color: #800000">two_array.npz</span><span style="color: #800000">'</span>,a=x,b=y) <span style="color: #008000">#</span><span style="color: #008000"> 对多个进行操作，进行压缩储存</span>
<span style="color: #008080">14</span> c = numpy.load(<span style="color: #800000">'</span><span style="color: #800000">two_array.npz</span><span style="color: #800000">'</span>) <span style="color: #008000">#</span><span style="color: #008000"> 提取文件</span>
<span style="color: #008080">15</span> c[<span style="color: #800000">'</span><span style="color: #800000">a</span><span style="color: #800000">'</span>] <span style="color: #008000">#</span><span style="color: #008000">第一个文件</span>
<span style="color: #008080">16</span> c[<span style="color: #800000">'</span><span style="color: #800000">b</span><span style="color: #800000">'</span>] <span style="color: #008000">#</span><span style="color: #008000">第二个文件</span></pre>
</div>
<p> </p>
<h2>二、pandas</h2>
<h3>1、Series</h3>
<div class="likecs_code">
<pre><span style="color: #008080"> 1</span> <span style="color: #0000ff">import</span><span style="color: #000000"> numpy as np
</span><span style="color: #008080"> 2</span> <span style="color: #0000ff">import</span><span style="color: #000000"> pandas as pd
</span><span style="color: #008080"> 3</span> <span style="color: #008000">#</span><span style="color: #008000">下面是创建Series的三种方法</span>
<span style="color: #008080"> 4</span> <span style="color: #008000">#</span><span style="color: #008000">方法1：s1 = pd.Series([1,2,3,4]) </span>
<span style="color: #008080"> 5</span> <span style="color: #008000">#</span><span style="color: #008000">方法2：s2 = pd.Series(np.arange(10)) # 通过numpy.arange创建</span>
<span style="color: #008080"> 6</span> <span style="color: #008000">#</span><span style="color: #008000">方法3：s3 = pd.Series({'1':1,'2':2,'3':3}) # 通过字典创建</span>
<span style="color: #008080"> 7</span> s1.values <span style="color: #008000">#</span><span style="color: #008000"> 查看值</span>
<span style="color: #008080"> 8</span> s1.index <span style="color: #008000">#</span><span style="color: #008000"> 查看索引</span>
<span style="color: #008080"> 9</span> s4 = pa.Series([1,2,3,4],index=[<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">B</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">C</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">D</span><span style="color: #800000">'</span>]) <span style="color: #008000">#</span><span style="color: #008000"> 设置索引</span>
<span style="color: #008080">10</span> s4.to_dict() <span style="color: #008000">#</span><span style="color: #008000"> 转化成字典</span>
<span style="color: #008080">11</span> pd.isnull(s4) <span style="color: #008000">#</span><span style="color: #008000">判断其中元素是否为NaN，pd.notnull()同理</span></pre>
</div>
<h3>2、DataFrame</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> <span style="color: #0000ff">from</span> pandas <span style="color: #0000ff">import</span><span style="color: #000000"> Series,DataFrame
</span><span style="color: #008080">2</span> <span style="color: #008000">#</span><span style="color: #008000">通过粘贴板导入dataframe</span>
<span style="color: #008080">3</span> df = pd.read_clipboard() <span style="color: #008000">#</span><span style="color: #008000"> 在此之前需要你copy一个表</span>
<span style="color: #008080">4</span> df.columns  <span style="color: #008000">#</span><span style="color: #008000"> 输出列名</span>
<span style="color: #008080">5</span> df.<span style="color: #800000">'</span><span style="color: #800000">列名</span><span style="color: #800000">'</span>  <span style="color: #008000">#</span><span style="color: #008000"> 输出列的数值(是一个Series)</span>
<span style="color: #008080">6</span> df_new = DataFrame(df,columns=[<span style="color: #800000">'</span><span style="color: #800000">列名1</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">列名2</span><span style="color: #800000">'</span><span style="color: #000000">])
</span><span style="color: #008080">7</span> s1 = pd.Series(df[<span style="color: #800000">'</span><span style="color: #800000">列名</span><span style="color: #800000">'</span>])  <span style="color: #008000">#</span><span style="color: #008000"> 输出这一列，dataframe的每一列是一个series</span>
<span style="color: #008080">8</span> s1.index\values 即对series操作，或者通过s1[<span style="color: #800000">'</span><span style="color: #800000">索引值</span><span style="color: #800000">'</span>]</pre>
</div>
<p> </p>
<ul>
<li>df1.iterrows() #返回一个生成器，可以用for循环来访问
<ul>
<li>eg: for row in df1.iterrows():</li>
<li>print(row) #返回的数据为一个tuple</li>
</ul>
</li>
<li>s1,s2,s3为3个Series，用其组成一个人dataframe：
<ul>
<li>df_new = pd.DataFrame([s1,s2,s3],index=['A','B','C'])</li>
<li>　　# index是每个Series的名称</li>
<li>　　# 初始是按横向拼接成的dataframe</li>
<li>　　df1 = df1.T #转置，转置之后就和直接用dataframe生成的一样了</li>
</ul>
</li>
</ul>
<h2>三、IO操作：</h2>
<h3>1、从粘贴板读取</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df1 =<span style="color: #000000"> pd.read_clipboard()
</span><span style="color: #008080">2</span> df1.to_clipboard() <span style="color: #008000">#</span><span style="color: #008000"> 写入粘贴板</span></pre>
</div>
<h3>2、CSV文件</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df1.to_csv(<span style="color: #800000">'</span><span style="color: #800000">名字.csv</span><span style="color: #800000">'</span>,index=False) <span style="color: #008000">#</span><span style="color: #008000"> false则表示不添加索引号</span>
<span style="color: #008080">2</span> df2 = pd.read_csv(<span style="color: #800000">'</span><span style="color: #800000">df1.csv</span><span style="color: #800000">'</span>) <span style="color: #008000">#</span><span style="color: #008000"> 读取CSV文件</span></pre>
</div>
<h3>3、json</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df1.to_json() <span style="color: #008000">#</span><span style="color: #008000"> 转化成json文件</span>
<span style="color: #008080">2</span> pd.read_json(df1.to_json()) <span style="color: #008000">#</span><span style="color: #008000"> 读取json文件</span></pre>
</div>
<h3>4、html</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df1.to_html(<span style="color: #800000">'</span><span style="color: #800000">df1_html</span><span style="color: #800000">'</span>) <span style="color: #008000">#</span><span style="color: #008000"> 转换成HTML文件</span></pre>
</div>
<h3>5、excel</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df1.to_excel(<span style="color: #800000">'</span><span style="color: #800000">df1.xlsx</span><span style="color: #800000">'</span>) <span style="color: #008000">#</span><span style="color: #008000"> 生成Excel文件</span></pre>
</div>
<h2>四、Selecting and Indexing</h2>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df.head() <span style="color: #008000">#</span><span style="color: #008000"> 返回前五行</span>
<span style="color: #008080">2</span> df.tail() <span style="color: #008000">#</span><span style="color: #008000"> 返回后五行</span>
<span style="color: #008080">3</span> <span style="color: #008000">#</span><span style="color: #008000"> 返回更多的内容则在括号中写出来，不写则默认为五行</span>
<span style="color: #008080">4</span> df.iloc[:,:] <span style="color: #008000">#</span><span style="color: #008000">索引切片，定位，基于index，与索引名无关</span>
<span style="color: #008080">5</span> df.loc[:,:] <span style="color: #008000">#</span><span style="color: #008000"> 根据索引名来，label来过滤</span></pre>
</div>
<h3>Reindex:</h3>
<h3>~~series</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> s1.reindex(index=[<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">B</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">C</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">D</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">E</span><span style="color: #800000">'</span>],fill_value=10<span style="color: #000000">)
</span><span style="color: #008080">2</span> <span style="color: #008000">#</span><span style="color: #008000"> fill_value 是指当重新写的index中有原来没有的，那么他本身输出为NaN，fill值为添加到这个索引下的值</span>
<span style="color: #008080">3</span> <span style="color: #008000">#</span><span style="color: #008000"> 创建一个新Series，另一种赋值的方法</span>
<span style="color: #008080">4</span> s2 = Series([<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">B</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">C</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">D</span><span style="color: #800000">'</span>],index=[1,5,10<span style="color: #000000">])
</span><span style="color: #008080">5</span> s2.reindex(index=range(15)) <span style="color: #008000">#</span><span style="color: #008000"> 生成15个索引的Series，除了原有的其他的都是NaN</span>
<span style="color: #008080">6</span> s2.reindex(index=range(15)，method=<span style="color: #800000">'</span><span style="color: #800000">ffill</span><span style="color: #800000">'</span>) <span style="color: #008000">#</span><span style="color: #008000"> 在上一步的基础上，按顺序将上一个value填充到他下面的几个中（forward fill）</span>
<span style="color: #008080">7</span> s1.drop(<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>) <span style="color: #008000">#</span><span style="color: #008000"> 表示删除A的内容</span></pre>
</div>
<h3>~~dataframe</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> <span style="color: #008000">#</span><span style="color: #008000"> 创建一个5*5的，通过numpy进行reshape</span>
<span style="color: #008080">2</span> df1 = DataFrame(np.random.rand(25).reshape([5,5]),index=[<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">B</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">D</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">E</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">F</span><span style="color: #800000">'</span>],colums=[<span style="color: #800000">'</span><span style="color: #800000">c1</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">c2</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">c3</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">c4</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">c5</span><span style="color: #800000">'</span>]) <span style="color: #008000">#</span><span style="color: #008000"> 遗漏的index中的C，通过reindex来恢复</span>
<span style="color: #008080">3</span> df1.reindex(index=[<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">B</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">C</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">D</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">E</span><span style="color: #800000">'</span>,<span style="color: #800000">'</span><span style="color: #800000">F</span><span style="color: #800000">'</span>]) <span style="color: #008000">#</span><span style="color: #008000"> C被恢复并把value填充为NaN</span>
<span style="color: #008080">4</span> <span style="color: #008000">#</span><span style="color: #008000"> columns 同理</span>
<span style="color: #008080">5</span> <span style="color: #008000">#</span><span style="color: #008000"> 当index减少时就表现出切割的现象</span>
<span style="color: #008080">6</span> df1.drop(<span style="color: #800000">'</span><span style="color: #800000">A</span><span style="color: #800000">'</span>,axis=0) <span style="color: #008000">#</span><span style="color: #008000"> axis=0，代表删除行；axis=1，代表删除列（后面遇到axis同样是这个意思）</span></pre>
</div>
<h2>五、NaN</h2>
<ul>
<li>n = np.nan
<ul>
<li>type(n) 是个浮点数float</li>
<li>与nan的运算结果均是nan</li>
</ul>
</li>
</ul>
<h3>nan in series：</h3>
<ul>
<li>s1.isnull\notnull() 判断是否为nan</li>
<li>s1.dropna() # 删除掉value为NaN的行</li>
</ul>
<h3>nan in dataframe：</h3>
<ul>
<li>判断同series</li>
</ul>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> df.dropna(axis=0,how=<span style="color: #800000">'</span><span style="color: #800000">any</span><span style="color: #800000">'</span>，thresh=None) <span style="color: #008000">#</span><span style="color: #008000"> axis表示行和列0,1来表示,how为any时表示有Nan就删掉，为all时表示全为nan时才删掉；thresh表示一个界限，超过这个数字的nan则被删掉</span>
<span style="color: #008080">2</span> df.fillna(value=1) <span style="color: #008000">#</span><span style="color: #008000"> 表示所有为nan的地方填充为1</span>
<span style="color: #008080">3</span> df.fillna(value={0:0,1:1,2:2,3:3}) <span style="color: #008000">#</span><span style="color: #008000"> 表示第一列的填充1，第二列的填充2，后面同理</span></pre>
</div>
<p><span style="text-decoration: underline">注：dropna,fillna不改变原始数组</span></p>
<h2>六、多级index</h2>
<ul>
<li>index=[['1','1','1','2','2','2'],['a','b','c','a','b','c']] # 1,2为一级标题，abc为二级标题，即1的series下有abc，原始series下有1,2；获取内容时，可以s1['1']['a']</li>
<li>s1[:,'a'] 返回所有一级series里的a</li>
<li>与dataframe的转换：
<ul>
<li>df1 = s1.unstack()</li>
</ul>
</li>
<li>逆转换：
<ul>
<li>s2 = df1.unstack() # 这时一二级换了位置</li>
<li>s2 = df1.T.unstack() # 这时是和原始完全一样的</li>
</ul>
</li>
</ul>
<p><span style="text-decoration: underline">注：dataframe的index和columns都可以转换成多级的</span></p>
<h2>七、mapping and replace</h2>
<p> 当想在一个dataframe中加一列(columns)，可以直接加df['列名']=Series([数据])<br>		也可以通过map：创建一个字典，字典中的键是dataframe中的columns：<br>			df1['新列名'] = df1['字典中的键那一列'].map(那个字典) 这个可以固定对应位置，方便改值，可以指定index来改值</p>
<h3>		replace in series:</h3>
<div class="likecs_code">
<pre><span style="color: #008080">1</span> s1.replace({1,np.nan}) <span style="color: #008000">#</span><span style="color: #008000"> 通过字典来改值</span>
<span style="color: #008080">2</span> s1.replace([1,2,3],[10,20,30]) <span style="color: #008000">#</span><span style="color: #008000"> 把123索引改成10,20,30</span></pre>
</div>
<p> </p>
<p>　　<em>以上内容是我的一点点总结，希望能给有需要的朋友带来带你帮助，也希望有大神来指点指点。</em></p>
</div>


		</div>
		
	</div>
	</div>
<!--end: topics 文章、评论容器-->
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                <p>分类：</p> 
                                <a class="cateclass" href="/default/index/cates?cid=229&cname=python" title="python">python</a>
                                                                <p>技术点：</p>
                                <a class="cateclass" href="/default/index/tags?cid=367&cname=python" title="python">python</a>
                                <a class="cateclass" href="/default/index/tags?cid=367&cname=numpy" title="numpy">numpy</a>
                                <a class="cateclass" href="/default/index/tags?cid=367&cname=pandas" title="pandas">pandas</a>
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">原文链接：https://www.cnblogs.com/yudanqu/p/python_numpy_pandas.html</p>')  
            }) 
</script> 
</body>
</html>