Stars
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
Graph Neural Network Library for PyTorch
越来越多的网站具有反爬虫特性,有的用图片隐藏关键数据,有的使用反人类的验证码,建立反反爬虫的代码仓库,通过与不同特性的网站做斗争(无恶意)提高技术。(欢迎提交难以采集的网站)(因工作原因,项目暂停)
实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、企查查、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评、携程、小米应用商店、安居客、途家民宿❤️❤️❤️。微信爬虫展示项目:
A Python module to bypass Cloudflare's anti-bot page.
Python爬虫实战 - 模拟登陆各大网站 包含但不限于:滑块验证、拼多多、美团、百度、bilibili、大众点评、淘宝,如果喜欢请start ❤️
实现文字点选、选字、选择、点触验证码识别,基于pytorch训练
基于MobileNetV2/EfficientNet-b0/... + LSTM + CTC的不定长图像识别训练pytorch框架
scrapy框架爬取51job(scrapy.Spider),智联招聘(扒接口),拉勾网(CrawlSpider)
Taobao Product Spider by Selenium
Downloader Middleware to support Pyppeteer in Scrapy & Gerapy
generate any type of captcha with one config. 一套配置,一行代码,快速生成任意风格验证码。
抖音大部分接口,以及快手的首页feed接口 soul app接口 nice app接口 毒app加签接口
简单的 python 爬取网站的案例 全网代理、58 到家、房价网、东方财富、ITOrange、邮政编码、康美中药、拉钩、猫眼、投融资、中国裁判文书网、自如网、百科网、中国房价网、网易云音乐、去哪儿网、汽车之家
A Python 3 to Node.js + vm2 binding, helps you execute JavaScript safely.
易盾图标识别,包含定位以及点选顺序的识别,定位 pytorch 模型大小只有3M,执行速度极快。内附代码和测试用例,直接使用即可测试。定位准确率 95% 以上,识别用的sift算法,测试通过率大概 50%。