全国服务热线:400-6263-721

位置:佛山达内IT教育培训学校 > 学校动态 > 佛山达内教育分享python爬虫学习路线

佛山达内教育分享python爬虫学习路线

来源:佛山达内IT教育培训学校时间:2023/6/14 17:35:24

  python爬虫学习路线

  我在学习Python爬虫之前,只有一点点C++基础。所谓“一点点”,指的是看过谭浩强的《C++程序设计》、砖头一样的《C++Primer》(当然,后者没看完),有接触实验室的MFC大型项目经验,但是对于数据结构、类、封装等概念,理解得都不到位。

  在这样的基础上,由于种种原因,开始学习Python。

  (1)学习Python基础

  开始阅读《零 基础入门学习Python》,看了三天,初始Python的基本语法、列表和字典、包和模块等概念。推荐小甲鱼的这本书作为入门,书籍是基于Python3作为开发语言,具有时效性;语言轻松易懂;一边抄代码一边学语法,3天即可以稍微上手Python。在这三天间,还参考百度教程,配置好Python的运行环境。在win7环境下,安装了Python3.6,Anaconda3,PcCharm,后来才发现,只需要下载一个Anaconda3就可以了0-0熟悉了Python的运行环境,熟悉了pip、conda等命令的用法、第三方包的安装。此外,还配置了MySQL、Navicat、PowerBI等相关软件。现在想想,有点多余了,其实暂时是用不到的。但在做项目的时候,终会用到。

  (2)初识Python数据分析

  由于刚开始的时候,把自己的求职目标定位为“基于Python的数据分析师”,因此还检索了很多数据分析的岗位JD。包括数据分析的岗位要求、学习规划、职业分类等等。自己也很懈怠。

  11月27-12月4日去厦门大学出差,期间只能看看书。看的是《利用Python进行数据分析》,草草浏览了一遍,只记得NumPy、Matplotlib、pandas这几个包的名字而已=-=京东双11的时候,买了《利用Python进行数据分析》、《Python金融大数据分析》、《Python基础差入门学习》、《谁说菜鸟不会数据分析》、《深入浅出数据分析》这几本书,一共大概200元,但是过了一个月,目前只看了《Python基础差入门学习》这一本而已。。。

  (3)初学Python网络爬虫

  出差返校之后,重新定位了一下:把“爬虫工程师”作为学习Python的阶段性目标。大概花了一周时间去攻克,学习到的知识有:

  1、网页的基本知识:get和post的含义、html的含义及基本格式;

  2、爬虫的基本原理:分析网页-请求网页-返回网页信息-解析网页-下载文件-保存文件;

  3、爬虫相关的第三方包:请求网页用的是requests,解析网页有三种方法(re、lxml、BeautifulSoup),这三个包是爬虫的重中之重;

  4、Python环境下对本地文件的读写:下载文件则需要自己写一个download函数,os包的使用;

  5、网页URL的分析方法,需要用for循环获取某些嵌套网页的url;

  6、使用浏览器调试url的方法,F12和寻找scr、href等;

  学习的方法,就是不断的寻找网上的示例,先自己在spyder中手动敲一遍,然后逐句逐句的分析每一条代码的含义。重复2-3个例子之后,会发现所有的爬虫都基本是这个套路。这个重复的过程一周足矣。0-0爬取妹子图,对于内心成就感的提升是较大的。。。

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/3316/news/632194/违者必究! 以上就是佛山达内IT教育培训学校 小编为您整理 佛山达内教育分享python爬虫学习路线的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-6263-721