- 阅读官方文档
- 导图笔记
- hive必会50道sql
- hive在离线计算用的比较多,工作好找,有sql基础入门比较快
- hive开窗函数
- 总结文档
- Flink 常见QA
- Flink介绍博客
- Flink 阿里直播(每周四晚20:00-21:00))
- 不搭建环境,socket代码模拟kafka数据源 开发flink
- Flink示例代码-实时计算违反尾号限行车辆
- 真.流计算利器,但是资料比较少,建议直接看官方文档 我会将自己的翻译的文档和bug的解决方式不定期上传到Flink的对应目录下
- Flink开发满半年了 从无到有 现在日常使用flink进行简单的实时ETL和业务实时计算开发ok 不足:主要是写业务函数+简单算子,深点的东西还是没应用过(比如cep) 才刚开始
- 文档笔记
- phoenix 自定义UDFs函数
- 见HBase目录,不定期更新
- 阅读官方文档
- 导图笔记
- 全文检索 solr+kerberos验证(巨坑,文档稍后上传)
- solr 实时创建索引延迟问题 (增量3000w/天)
- solr百亿规模数据优化
- 占坑,可以直接使用dbms+es实现几千万数据可视化展示 汇总,底层跟solr一样,都是基于lucene
- ES性能优化-转载
- 这个真恶心 人机/机机
- 2019-5-5 更新 Fusioninsigh下的所有组件互通已经调试好
- 用空还是要学一下 最近做了个springboot实现solr rest服务 套的公司应用层模板
- 会不定期的将在工作中接触大数据组件时做的去敏测试代码上传到对应的文件夹下供初学者参考,少走弯路 包括自己每天更新的大数据印象笔记 更新的进度和规划在issues 中
- 今年计划重心是在实时计算上Flink,下半年的规划 : sparksql或flinksql flinksql推荐使用1.7.0+ 最近又让研究es