第三节:pandas进阶之提升运行效率
前言 如果你现在正在学习数据分析,或者正在从事数据分析行业,肯定会处理一些大数据集。pandas就是这些大数据集的一个很好的处理工具。那么pandas到底是什么呢?官方文档上说: " 快速,灵活,富有表现力的数据结构,旨在使”关系“或”标记“数据的使用既简单又直观。" 快速、灵活、简单、直观!这些听起来感觉很棒。如果你的工作涉及…
第二节:Pandas练习
分析1880到2017年出生的美国婴儿姓名 获取数据 数据规整 分析数据 1、获取数据 链接:https://pan.baidu.com/s/1wIyRZfgR7EjQ_KFP5-cnaA 提取码:g0zy 2、数据规整 因为获取到的数据是根据出生年份分为了多个文件,其中文件内部的数据也是简单的通过逗号分隔而成的,所以需要规整一下: years =…
第二节:numpy练习题
numpy练习 import numpy as np # 1、创建一个大小为10的空向量 # 2、创建一个大小为10的空向量,但是第五个值为1 # 3、创建一个10-49的ndarray数组 # 4、创建一个3x3的矩阵,其值在0-8之间 # 5、创建包含随机值的10x10数组,并且找到最小值和最大值 # 6、创建大小为30的随机向量,找到平均值 …