学好Python,混口饭吃!!!
学好Python,混口饭吃!!!
学好Python,混口饭吃!!!
【战胜拖延症,组团学 Python】准备工作:1. 安装 Python32. 配...#掘金沸点# https://juejin.im/pin/5bc400105188250d2520d3ef
同学们,来掘金沸点下打卡咯~
学习从hello world 开始~
【战胜拖延症,组团学 Python】准备工作(二):1. 安装一个代码编辑器。(...#掘金沸点# https://juejin.im/pin/5bc55064f265da6aedfc798a
需要掌握:
- 变量的定义
- 变量赋值
- 运算符(赋值、算术、关系、逻辑)
- 表达式
- input()捕获键盘输入,额外了解一下!!
目的:主要是学习一下上面的一些基础知识
参考资料:
【战胜拖延症,组团学 Python】第一课:
- 掌握 Python 变量,输入输出,+-*/%运算
- 编写 Python 程序,此程序可以从命令行接收一个数字输入,并输出以该数字为半径的圆的周长和面积。
阅读 Learn Python3 the hardway Exercise1 至 Exercise8 + Google 搜索可以完成此次打卡任务。
⛽️你已经超过了30%的人。
反馈问题:经过各个队员的反应,因为工作和私人生活时间的问题,故进行任务的微调!尽量安排学习一些比较简单,基础的知识打基础。由于工作日的学习时间和任务比较轻松,所以周末会有一个相对于比较重的练习或者学习任务,希望大家可以完成。(PS:大家对这写学习任务有疑惑或者有建议可以提出来)
需要掌握:
- 数值类型(整型、长整型、浮点型、复数型)(这个,昨天应该有了解过了)
- 字符串类型
- 元组
- 列表(增、删、改、查及一些方法)
- 记得每天打卡~
目的:掌握上面知识点,不要求全部都很熟练,最起码知道有这么一回事。
【战胜拖延症,组团学 Python】第二课
- 掌握 Python 的 if-else 分支结构以及 while for 循环(包括 continue 和 break)
- 编写一个程序,该程序可以从命令行接收一个数字输入并判断该数字是否为素数。
阅读链接中的 Python 基础部分,配合搜索可以完成此任务。
⛽️你已经超过50% 的人了
- 循环(for、while)、条件判断(if)的使用(先看完这个,再了解一下素数是什么,就可以做打卡任务了)
- 字典定义
- 定义字典的方法
- 直接读、改字典的value值
- 字典的方法熟悉练习下:keys()、value()、get()、items()、copy()、clear()、pop()、update()、fromkeys()等
- 判断一个key是否在字典里的方法
- set数据类型也看一下
- 记得每天打卡 - https://juejin.im/pin/5bc7e7bbf265da6aedfc8759
- 上面的知识点都举例操作一遍并上传代码
- 使用for … in ……循环访问字典的key以及value(单独打印k、单独打印value、同时打印key和value)
【战胜拖延症,组团学 Python】第三课:1. 了解 Python 的基本数据...#掘金沸点# https://juejin.im/pin/5bc945ddf265da6aedfc9161
- 函数-了解基本使用就行,后续再深入了解
- 异常处理-也是了解异常捕获就行,不做深入了解
- 模块学习(这个是重点!!!!)
- 如何安装模块
- os模块使用
- Requests的使用
- 文件的读写(读写文本,根据图片url存图片)
- 打卡(日常任务) PS:稍后更新
【战胜拖延症,组团学 Python】第四课:
- 掌握链接中 Python 教程的高级特性
- 利用生成器生成斐波那契数列
- 打卡链接:https://juejin.im/pin/5bcaeb5a6fb9a04d63f32ea9
⛽️你已经超过了82%的人
【战胜拖延症,组团学 Python】第五课:
-
回顾前面所学的内容
-
在无参考资料的前提下,尽量多的写下你能回忆起的 Python 知识。
特殊的打卡方式:将你回忆的知识发布在沸点,评论留下你的沸点链接。
⛽️你已经超过了 90% 的人。
【战胜拖延症,组团学 Python】第六课:1. 阅读链接中的函数式编程部分(到...#掘金沸点#
-
- 我们组的内容要比掘金的打卡超前一些..比如说我们每天可以学一部分+一个练习,基础不够的同学,允许滞后一天,一个周有滞后的内容,可以在周末多花时间,多请教完成
-
- 分级安排学习目标,简单到负杂,我们没有时间简单可以先搞,等我们时间充足就都完成这项负杂的.先学习简单,然后复杂运用
比如你今天完成不了(因为工作问题,挤不出时间), 可以推迟到明天.
但是明天的学习目标我们还是正常下发.
完成不了自己抽时间补回来.
如果大家都有遗留的问题多,就适当的调整一下!!!
如果大家都有遗留的问题多,就适当的调整一下!!!
如果大家都有遗留的问题多,就适当的调整一下!!!
如果就一个人左右,那么就继续.
!!! 当然, 来不及补也可以, 你就相当于延期 "毕业"
延期毕业: 也就是我们计划安排一个月结束,但是你因为中间因为各种原因,
没有及时完成学习目标, 所以你就 "毕业" 要花一个月的时间+你延期的时间
【战胜拖延症,组团学 Python】第七课: 0. 有很多人反馈难度有点大,但实际上还可以。今日继续下面的题吧👇
- 阅读链接中的函数式编程部分。
- 利用装饰器给之前课程所写的判断素数的程序增加一个「有趣的」功能。
将你写的程序源码及输出截图在评论下回复即可打卡。
⛽️你已经超过了90%的人。
- 在day09目录下新建下面结构的目录:一级目录language,二级目录python,三级目录learn;并且每个目录下放置一个index.txt文件
- 创建目录必须使用os模块的相关知识
- index.txt可以手动创建
- 遍历练习1目录下的所有的文件以及子目录下的所有文件
- 使用os.walk()直接遍历文件和目录(优先这个方法)
- 自己编写递归函数去遍历文件和目录(有兴趣的可以完成,不做统一要求)
- Requests的了解和基本使用
- 文件读写的基本操作
- 掘金日常打卡
今天的练习就一个,就是看完学习目标后,利用Requests模块和文件读写来存储掘金沸点的请求url链接里的content内容,用追加的方式,写入到一个文件中
练习实现思路提示:
- 沸点数据的请求链接,可以通过F12的network查找
- 通过Requests的get方法请求沸点url链接
- 然后用json()方法获取请求到的的内容,是一个字典类型的数据
- 接着就是for……in……循环拿到的字典中的key为list的列表数据就好了
- 写文件的的方式:
- 用追加模式在for循环里打开一个文件对象,然后持续写入
- 在for循环外用写文件的模式打开一个文件对象,然后持续写入
- 写完文件最后都要记得关闭文件对象,或者使用with……的语法
【战胜拖延症,组团学 Python】第八课: 0. 放慢节奏,不要着急。
- 装饰器没看懂的继续看装饰器
- 学会安装第三方模块
将安装的第三方模块版本截图发在评论区即可打卡成功。
⛽️你已经超过了90%的人。
- 利用相应的模块进行各种文件存储操作
- JSON字符串存储(用到的模块:json;进行读、写操作)
- Excel表格存储(用到的模块:pandas或openpyxl;读、写操作)
- Image图片存储(写操作)
图片参考URL http://img.shujuren.org/pictures/GB/57ff13a89b3b8.png
- MP4视频存储(写操作)
视频参考URL http://www.runoob.com/try/demo_source/movie.mp4
- MP3音频存储(写操作)
音频参考URL https://m10.music.126.net/20181025110650/cf49d099633c1fdd15bf8509386ac0fe/ymusic/e627/765b/7bbd/63198cca3f00a94bb0952dc1f0d507e7.mp3
- CSV文件存储(用到的模块:csv或pandas;读、写操作)(先完成上面的,然后这个有时间最后完成,没时间的话,也要了解一波)
- 掘金日常打卡
- 网上查找资料,并理解怎么使用,例如Google搜索“python json 文件读写”,然后看用到了什么模块或方法,以及怎么使用
- 查完资料后,各种存储文件的方式都举例操作一遍并上传代码
- 安装配置好MySQL数据库
- 安装pymysql模块
- 掘金日常打卡
- 爬取掘金沸点的数据(最少获取两个字段,自由发挥),分别存储到Excel表格,json文件,CSV文件.
- 练习数据库建表,增删改查的基本操作(下面两个都要实现)
- 使用默认的cursor语法
- 使用pymysql模块语法
- 正则表达式
- 怎么定义一个正则表达式
- 正则表达式的使用
- 面向对象编程的基本使用
- 知道什么是面向对象编程,什么是类以及实例
- 了解怎么定义一个类,类方法,类属性
- 明白怎么调用类属性,类方法
- 编写一个简单的正则表达式,验证输入的手机号码是否正确(1开头的11位数字)
- 编写一个简单的正则表达式,验证输入的身份证号码是否正确(18位数字,有的可能最后一个数位为小写x或者大写X)
- 找一个以前写过的练习,然后用面向对象的编程方式来封装,并调用
-
- datetime
- base64
- struct
- hashlib
- 等等
-
日常打卡
- 熟悉练习常用的第三方模块
学习了那么多知识,铺垫了那么久,咋们可以进入爬虫了!!!
- 练习一:爬取(猜你喜欢)的所有图片 --- 这个在上面靓汤的右边,注意!!!!!
- 练习二(进阶练习):在练习一的补充下,爬取文章标题以及文章发布时间(其实就是一个练习)
- 继续学习和理解BeautifulSoup模块的使用
- 爬取国家统计局2017年区域和城乡划分代码的省市区街道办事处信息
- 可以先只爬取其中一个省的信息
- 保存格式,可以选择Excel、json、txt等任意格式
- 链接直通车:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/
- 爬取国家地理杂志的首页信息
- 爬取首页数据列表的图片和图片上面的文字
- 然后再跳转到 "更多内容" 爬取里面的数据
- 自己决定存储方式
- 学习进程和线程(要求理解)
- 优先爬虫!!
【战胜拖延症,组团学 Python】第八课:
- 昨天尝试抓取掘金的关注用户,我已经做到了。so~
- 阅读掘金小册《基于 Python 实现微信公众号爬虫》试读部分
- 抓取掘金任一账号的所有关注者 昵称和ID 并保存为 json 文件
回复代码截图即可成功打卡,海绵会从打卡的人中抽5位送出《基于 Python 实现微信公众号爬虫》各一本。
- 掘金重新恢复打卡,记得打卡 → https://juejin.im/pin/5be113e56fb9a04cc73b900d
- 之前落下的学习任务,找时间补补
- 补前面落下的就行
【战胜拖延症,组团学 Python】
XXXXXXXXXXXXXXXXXXXXXXXXXXXX
- 补前面落下的
- 可以的话,使用Scrapy来做些例子
【战胜拖延症,组团学 Python】
XXXXXXXXXXXXXXXXXXXXXXXXXXXX
- 了解Selenium,及其基本语法和用法,可以参考下面的教程,更多的可以自己Google
- 掘金日常打卡
- 尽量把各个用法和知识点都练习一遍,加深印象
- 了解splinter,及其基本语法和用法,可以参考下面的教程,更多的需要自己Google
- splinter官方教程中文版
- Google/Baidu
- 尽量把各个基础用法和知识点都熟悉一遍,加深印象
- 利用selenium爬淘宝商品
- 进入淘宝首页
- 输入一个商品关键词进行搜索(商品关键词自己定)
- 然后爬取商品信息(信息包含:商品图片,价格,购买人数,名称,所属店铺,店铺地点,商品链接……)
- 下载图片,其他文本信息的存储格式自己定
- 有分页的,需要分页爬取
- 在完成练习2的前提下,尝试用splinter替换selenium再实现同样的爬淘宝商品的练习
【战胜拖延症,组团学 Python】第十课:前几天有人在群里咨询掘金前端分类有多...#掘金沸点# https://juejin.im/pin/5be93f8d6fb9a0567836c199
- 继续上次的学习,这两天放松下
- 打卡,打完之后该干啥就干啥
咋们的活动到此结束了,但是我们的爬虫之旅才刚刚开始.
以后会有继续学习目标,但是可以不用上传代码和打卡了.你们开心就好.
终于没人来烦你们了!!!
See You Next Time~
Matplotlib是一个Python 2D绘图库,它可以在各种平台上以各种硬拷贝格式和交互式环境生成出具有出版品质的图形。 Matplotlib可用于Python脚本,Python和IPython shell,Jupyter笔记本,Web应用程序服务器和四个图形用户界面工具包
Matplotlib试图让简单的事情变得更简单,让无法实现的事情变得可能实现。 只需几行代码即可生成绘图,直方图,功率谱,条形图,错误图,散点图等。
1.熟悉matplotlib的基本使用