- 蚂蜂窝指定关键词爬取游记和景点信息
- 提取文章景点
- 分析、计算热度,绘制图表
- 使用高徳API绘制景点热力图
Spider运行顺序:
动态信息爬取依赖Splash实现
- note_index
- travel_notes
- places
Analysis部分运行顺序:
- base_analysis.py 数据整理
- purify_score.py 清洗,导出csv
- place_score_sort.ipynb 排序,图表
- build_heatmap_data.py 构造热力图数据
- start_server.py 展示热力图