目录

用-Python-进行数据分析,有哪些合适的-Python-书籍或资料值得推荐

用 Python 进行数据分析,有哪些合适的 Python 书籍或资料值得推荐

我是用 做 的,市场上python资料简直多如牛毛,真正值得看的没多少。人生苦短,少看垃圾。

补充:下面还有很多干货!!!


正文开始

先看看python岗位概况:

https://i-blog.csdnimg.cn/img_convert/b04e34a4bcc967df3b583773d80bfe99.webp?x-oss-process=image/format,png

图片来源网络

针对数据分析岗位需要的python技能,这里分为三大块来讲。

1、数据分析需要用到那些python知识点;

2、Python数据分析最主要的工具库有哪些;

3、学习数据分析各阶段用到什么书籍或资料;

首先,python可以用作 、 、 、 、 、数据分析等各个领域,每个领域对python的学习要求和深度不一样,数据分析不要求掌握很深的编程知识。

主要是以下内容, 数据类型和结构、变量、函数、逻辑语句(判断、循环)、匿名函数、错误处理、遍历和迭代、进程和线程、库的使用 。学习这些东西并不需要购买书籍,能省则省,网上很多教程。推荐 菜鸟教程w3cschool 的python3教程,通俗易懂,非常适合初学者掌握基础语法,然后可以在 实验楼 这个网站练习编程,也可以自己搭建环境敲代码。

编程毕竟是抽象的,一开始理解诸如切片、迭代等概念比较吃力,只有多看多敲代码,后面自然而然就懂了。

学完python基础知识点,并有了一定的训练代码量(至少得 1000 行)之后,就可以开始学习数据分析工具了,也就是python的第三方数据分析库。按照我的使用经验和个人理解,有以下几个重点学习对象。

& 它是一个由多维数组对象和用于处理数组的例程集合组成的库,里面包含了大量的计算函数,可以很轻松的进行科学计算。

https://i-blog.csdnimg.cn/img_convert/a84be4550c74b44a412f1d3c65c6ff59.webp?x-oss-process=image/format,png

图片来源网络

是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的,具备强大的数据展示功能。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

https://i-blog.csdnimg.cn/img_convert/5a23deef8bceac8332c821baca5630cd.webp?x-oss-process=image/format,png

是一个Python 2D绘图库,可以生成各种硬拷贝格式和跨平台交互式环境的出版物质量数据。Matplotlib可用于Python脚本,Python和IPython shell,Jupyter笔记本,Web应用程序服务器和四个图形用户界面工具包。只需几行代码即可生成绘图,直方图,功率谱,条形图,误差图,散点图等。

https://i-blog.csdnimg.cn/img_convert/6d1e337d6c13c793a11c2a128413588b.webp?x-oss-process=image/format,png

图片来源网络

是一个机器学习库,可以对数据进行分类,回归,无监督,数据降维,数据预处理等等,包含了常见的大部分机器学习方法。

https://i-blog.csdnimg.cn/img_convert/f12f16cf6806ce133d3df9db656a7b28.webp?x-oss-process=image/format,png

图片来源网络

上面五种工具 scipynumpy、pandas、matplotlib、scikit-learn ,基本能解决90%以上的数据分析问题,建议初学者把这五个工具重点用。

至于教程,推荐 《利用python进行数据分析》 第二版,可以掌握numpy、pandas、matplotlib的许多实用用法。我基本把这本书看完了,也敲了里面大部分代码。学习scikit-learn最好选择看 ,目前好像也有了 ,可以多跑跑里面的sample。

https://i-blog.csdnimg.cn/img_convert/8c1ac147c699c951e4b557c4dba2c900.webp?x-oss-process=image/format,png

sklearn文档案例(图片来源网络)

最后捎带提一下,还要学习SQL,这是数据分析最基础的能力,我用的是 《SQL学习指南》 这本书,很适合入门。

另外,对于所有有志于做数据分析师、商业数据分析、数据治理的小伙伴,一定要加快提升自己。 世界经济论坛 发布的 《2023年未来就业报告》 对未来五年就业市场进行深入分析,报告预测未来5年内增长最快的十大岗位,就包括了 数据分析师和科学家 以及 数字化转型专业人员

https://i-blog.csdnimg.cn/img_convert/c22716713dd0b42d97d190ecf593beb9.png

强烈建议重视CDA数据分析师证书,CDA数据分析师一级考试涉及的多个业务分析模型, 这些模型在实战中超有用 。尤其是想进入 电网、银行、电信、烟草 行业的小伙伴们,尽量考过CDA数据分析师二级,因为这些单位几乎都会在招聘中说明CDA数据分析师优先。

大家考个证书,既可以巩固自己的数据分析技术,还能有证书加持,对于部分工作有很大好处。


最后再梳理一下学习路径和教程,python基础语法( 菜鸟教程和w3cschool )»numpy、pandas、matplotlib(《 利用python进行数据分析 》)»scikit-learn( 官方文档

我收集了一些python学习书籍

python基础:

  • 《Python基础教程》( Beginning Python From Novice to Professional
  • 《Python学习手册》( Learning Python
  • 《Python编程》( Programming Python
  • 《Python编程从入门到实践》( Python Crash Course
  • 《Python Cookbook》

python数据分析

  • 《利用Python进行数据分析》( Python for Data Analysis
  • 《Python数据科学手册》( Python Data Science Handbook
  • 《Python金融大数据分析》( Python for Finance
  • 《Python数据可视化编程实战》( Python Data Visualization Cookbook
  • 《Python数据处理》( Data Wrangling with Python

python机器学习

  • 《Python机器学习基础教程》( Introduction to Machine Learning with Python
  • 《Python机器学习实践指南》( Python Machine Learning Blueprints
  • 《Python机器学习实践:测试驱动的开发方法》( Thoughtful Machine Learning with Python A Test Driven Approach
  • 《Python机器学习经典实例》( Python Machine Learning Cookbook
  • 《TensorFlow:实战Google深度学习框架》

附 github大神开源的python数据科学速查小抄(仅供学习)

python

https://i-blog.csdnimg.cn/img_convert/cc61312912bea3528cd830250d85ec2a.webp?x-oss-process=image/format,png

pandas

https://i-blog.csdnimg.cn/img_convert/e4c8b36f4f1bd6db9a5149cdc67411c8.webp?x-oss-process=image/format,png

numpy

https://i-blog.csdnimg.cn/img_convert/f48b1b5b3a35a63dd5fab0d92ff53a14.webp?x-oss-process=image/format,png

scipy

https://i-blog.csdnimg.cn/img_convert/2d7c47769ad779260623f3b660357be2.webp?x-oss-process=image/format,png

sklearn

https://i-blog.csdnimg.cn/img_convert/22063b21a62ab68e4410aac2f2864108.webp?x-oss-process=image/format,png

matplotlib

https://i-blog.csdnimg.cn/img_convert/c54b3103b6fb9c8d23df1807c680f2ca.webp?x-oss-process=image/format,png

python基础

数据分析