第十四章 数据分析案例本书正文的最后一章,我们来看一些真实世界的数据集。对于每个数据集,我们会用之前介绍的方法,从原始数据中提取有意义的内容。展示的方法适用于其它数据集,也包括你的。本章包含了一些各种各样的案例数据集,可以用来练习。 案例数据集可以在Github仓库找到,...2023-09-25程技
第五章 Pandas 入门pandas是本书后续内容的首选库。它含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas经常和其它工具一同使用,如数值计算工具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matp...2023-09-25程技
附录A-NumPy高级应用在这篇附录中,我会深入NumPy库的数组计算。这会包括ndarray更内部的细节,和更高级的数组操作和算法。 本章包括了一些杂乱的章节,不需要仔细研究。 A.1 ndarray对象的内部机理NumPy的ndarray提供了一种将同质数据块(可以是连续...2023-09-25程技
附录B-更多关于IPython的内容第2章中,我们学习了IPython shell和Jupyter notebook的基础。本章中,我们会探索IPython更深层次的功能,可以从控制台或在jupyter使用。 B.1 使用命令历史Ipython维护了一个位于磁盘的小型数据库,用于保存执...2023-09-25程技
1 顺序表突发奇想,想用Python把数据结构的知识再过一遍,所以就开始从顺序表从头来一遍,Python内置了一些功能,感觉只需要定义方法调用就好了,或者不想这么干的话,直接调用内置的方法咯。 list 是一种元素个数可变的线性表,采用了分离式技术实现的动态...2023-09-25程技
2 单链表 单链表是一种链式的数据结构,链表中的数据用结点表示,保持了数据之间的逻辑关系,但存储空间不一定是按照顺序存储。 链表的基本元素有: 节点:包括数据域和指针域,数据域存放数据,指针域存放指向下一个元素的指针 head:头结点 tail:尾结点 N...2023-09-25程技
3 栈 栈是一种数据结构,只能从一端插入和删除操作,遵循着先进后出原则存储数据。 3.1 栈的初始化1234def __init__(self): self.stack = [] # 栈列表 self.size = 20 # 栈大小 ...2023-09-25程技
审计技能|Python语句(四):常用查询函数1.分组聚合函数(groupby)类似SQL的groupby那样的数据透视功能。可以使用pandas库的groupby函数来实现分组聚合操作。 举例: 有一个A表,分别有甲项目和乙项目,甲项目连续两年的销售为50万元和54万元,乙项目连续两年的销售额...2023-08-15审技
审计技能|Python语句(四):常用查询函数1.分组聚合函数(groupby)类似SQL的groupby那样的数据透视功能。可以使用pandas库的groupby函数来实现分组聚合操作。 举例: 有一个A表,分别有甲项目和乙项目,甲项目连续两年的销售为50万元和54万元,乙项目连续两年的销售额...2023-08-15审技
python数据分析专用数据库,与pandas结合,10倍提速+极致体验前言你有想过在 pandas 中直接使用 sql吗?我知道许多小伙伴已经知道一些库也可以做到这种体验,不过他们的性能太差劲了(基于sqlite,或其他服务端数据库)。 今天我要介绍另一个专用于数据分析的列式数据库,性能是其他同体验的库的1000倍以上...2023-08-12程技