资源整合 大数据与机器学习笔记,持续更新中。 其他平台,会不定时同步更新。 语雀-大数据 知乎专栏-大数据进击之路 公众号-cuteximi 作者 作者简介 直接访问 大数据主页 在 github 上查看 机器学习 从机器学习谈起 机器学习术语 机器学习路线 推荐两个网站,认清自己的阶段 分布式基础 分布式基础 大数据生态 HDFS MapReduce Hive 深挖底层 Hadoop HA 机制 MR原理和运行过程 NameNode内部解析 二次排序 kafka 解决方案 很多大厂解决方案 技术文章整理 技术文章整理 微信公众号文章 欢迎关注微信公众号:大数据进击之路 Spark Spark 调优 Spark shuffle 寻址流程 Spark shuffle 调优 Spark 数据本地化级别 Spark 的核心 RDD 以及 Stage 划分细节,运行模式总结 kafka kafka + sparkstreaming kafka 数据丢失与重复消费 HBase HBase 架构 HBase 架构补充 Hadoop Hadoop HA 原理分析 Hadoop系列之 1.0 和 2.0 架构 Hadoop系列之 Hive Hadoop系列之 Mapreduce Hadoop系列之 HDFS Flink Flink社区电子书 欢迎关注原创公众号 公众号:cuteximi 技术|思维|认知