Skip to content

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。

Notifications You must be signed in to change notification settings

bhsherry/InfoSpider

Repository files navigation

UW2eVx.png

UW2eVx.png UW2eVx.png UW2eVx.png

一个神奇的工具箱,拿回你的个人信息。

使用说明文档 | 视频演示 ️


🕷About

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。 目前支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。

详细使用说明参照使用说明文档

🎨Screenshot

screenshot.png

🚀QuickStart

依赖安装

  1. 安装python3和Chrome浏览器

  2. 安装与Chrome浏览器相同版本的驱动

  3. 安装依赖库 pip install -r requirements.txt

工具运行

  1. 进入 tools 目录

  2. 运行 python3 main.py

  3. 在打开的窗口点击数据源按钮, 根据提示选择数据保存路径

  4. 弹出的浏览器输入用户密码后会自动开始爬取数据, 爬取完成浏览器会自动关闭.

  5. 在对应的目录下可以查看下载下来的数据(xxx.json)

🌈数据源

  • GitHub
  • QQ邮箱
  • 网易邮箱
  • 阿里邮箱
  • 新浪邮箱
  • Hotmail邮箱
  • Outlook邮箱
  • 京东
  • 淘宝
  • 支付宝
  • 中国移动
  • 中国联通
  • 中国电信
  • 知乎
  • 哔哩哔哩
  • 网易云音乐
  • QQ好友
  • QQ群
  • 生成朋友圈相册
  • 浏览器浏览历史
  • 12306
  • 博客园
  • CSDN博客
  • 开源中国博客
  • 简书

📑计划

  • 对爬取的个人数据进行统计分析
  • 融合机器学习技术、自然语言处理技术等对数据深入分析
  • 把分析结果绘制图表直观展示
  • 添加更多数据源...

😘致谢

本项目基于MyDataHomes提供的Spider框架进行二次开发。

非常感谢MyData.Homes社区提供这样优秀的平台,为个人数据安全做出贡献。

😇Visitors

License

GPL-3.0

About

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 79.4%
  • HTML 17.1%
  • Jupyter Notebook 3.4%
  • Shell 0.1%