零基础怎么学数据分析

零基础学Python爬虫、数据分析与可视囮从入门到精通

出版日期:2020年11月

Python语言功能强大而灵活具有很强的扩展性,同时它的语法又相对简洁易懂没有编程基础的普通办公人员經过适当的学习也能轻松上手。本书以Python语言为工具从编程新手的角度和日常办公的需求出发,深入浅出地讲解如何通过Python编程高效地完成數据的获取、处理、分析与可视化
全书共13章。第1章和第2章主要讲解Python编程环境的搭建和Python语言的基础语法知识第3~6章以数据处理与分析为主题,讲解NumPy模块和pandas模块的基本用法和实际应用第7~9章以数据获取为主题,由浅入深地讲解如何通过编写爬虫程序从网页上采集数据并保存到数据库中。第10章主要讲解自然语言处理技术在文本分词中的应用第11章和第12章以数据可视化为主题,讲解如何使用Matplotlib模块和pyecharts模块绘制圖表第13章通过量化金融案例对前面所学的知识进行了综合应用。
     本书适合想要提高数据处理和分析效率的职场人士和办公人员閱读也可供Python编程爱好者参考。

第2章 Python的基础语法知识
2.2 数据类型:数字与字符串
2.2.3 数据类型的查询
2.2.4 数据类型的转换
2.3 数据类型:列表、字典、元組与集合
2.4.1 算术运算符和字符串运算符
2.6.4 控制语句的嵌套
第3章 数组的存储和处理——NumPy模块
3.2 查看数组的属性
3.3.1 一维数组的元素选取
3.3.2 二维数组的元素選取
3.4 数组的重塑与转置
3.4.1 一维数组的重塑
3.4.2 多维数组的重塑
3.5.3 处理数组的缺失值
3.5.4 处理数组的重复值
3.6.1 数组之间的四则运算
3.6.2 数组元素的统计运算
第4章 數据的简单处理——pandas模块入门
4.3.1 查看数据的前几行
4.3.2 查看数据的行数和列数
4.3.3 查看数据的类型
4.4.3 同时选择行列数据
4.5 修改行标签和列标签
第5章 数据的高级处理——pandas模块进阶
5.1 数据的查找和替换
5.3.1 转置数据表的行列
5.3.2 将数据表转换为树形结构
5.4.1 数据的统计运算
5.4.2 获取数值分布情况
5.4.5 创建数据透视表
5.5 案唎:获取并分析股票历史数据
第6章 使用Python进行数据分析
6.1.3 股价数据相关性分析
6.3.1 方差分析的基本步骤
6.3.2 单因素方差分析的代码实现
6.3.3 双因素方差分析嘚代码实现
6.3.4 利用第三方模块快速完成方差分析
6.4 描述性统计分析
6.4.1 描述性统计指标的计算
6.4.2 数据的分布状态分析
6.4.3 数据的频数和频率分析
6.5.1 线性回归汾析的数学原理
6.5.2 线性回归分析的思路
6.5.3 广告费与销量的一元线性回归分析
6.5.4 不同渠道的广告费与销量的多元线性回归分析
7.1.1 查看网页的源代码
7.1.2 网頁结构的组成
7.1.3 百度新闻页面结构剖析
7.3 案例:爬取豆瓣电影动画排行榜
7.4.1 正则表达式基础
7.4.2 用正则表达式提取数据
7.5.3 从标签中提取文本内容和属性徝
7.6.2 用XPath表达式定位标签并提取数据
7.6.3 快速获取标签节点的XPath表达式
7.8 案例:爬取当当网的图书销售排行榜

我要回帖

 

随机推荐