架构

目前公司用的监控系统的架构是: 客户端收集日志吐到kafka, 然后jstorm 消费kafka的消息, 存储到opentsdb, 用grafana 可视化

jstorm 架构

日志监控只有一个topology, 如果有系统需要新增对日志的监控, 则通过配置页面配置一条清洗过滤的规则, 满足规则的日志被存储到opentsdb, 一个系统所有的清洗日志对应一个component, 具体来说是对应一个spout, 满足条件的再下发到bolt(opentsdb 处理), 这个架构的优劣暂且不谈, 历史原因, 还没重构.

带来的问题

一个系统对应一个集合的清洗规则, 对应一个spout, 对应一个kafka topic, 新增一个系统, 需要新增spout, 目前jstorm 不支持对一个topology新增spout和bolt, 只支持动态更改topology的配置, 并选择对哪些spout/bolt生效
一个系统对应一个kafka的topic, 若消息量突然增大, 则这个spout不能满足需求, 需要动态新增task和worker, 这个jstorm 本身是支持动态缩容的, http://jstorm.io/ProgrammingGuide_cn/AdvancedUsage/DynamicAdjust/Parallel.html, 但是经过我们初步生产测试会影响整个topology 的sendTPS, 就是会影响其他系统的关键图表, 造成抖动, 这个无法接收

目标

针对问题2 因为官网文档中介绍, 不加入 -r 参数是不会引起task的重分配的, 所以性能问题让我们很疑惑, 想深入了解并调优JStorm, 做到不影响topology的性能,

解决思路

之前不了解JStorm的时候走的弯路就不说了, 正确的解决思路应该如下: task分配到worker的策略不能变, 老的task还是分配到原先的worker, 否则会造成旧有的task shutdown, 新的task create必然有性能消耗.

JStorm 架构

简单说下, 由nimbus, supervisor, worker, task 组成, topology和spout/bolt暂且不说, 跟这个问题关系不大. nimbus: 相当于集群的领导者, 跟yarn的RM 地位一致, 处理客户端提交的请求, 例如命令行执行的各种命令; 处理supervisor, worker, task的分配策略等 supervisor: 可以理解为yarn的NM, 负责管理各个工作节点, 分配worker worker: topology的执行进程, 由各个执行线程task组成, 例如更新topology的配置, 是由nimbus执行配置的更新, 并更新到zk的节点, worker watch到event的变化之后, 更新到具体的执行进程中去.

解决步骤

首先是要深入了解JStorm的rebalance的过程, 我采取远程调试nimbus, 看日志, 看源码的三种方式结合

一. 远程调试nimbus 一开始看源码还比较陌生, 就想通过远程调试测试服务器的方式, 能够看到一些关键变量的值, 排除一些看不懂的代码的干扰. jstorm使用 jstorm nimbus启动nimbus , 后面想到可以直接用 ps -ef|grep nimbus 的输出信息直接结合远程调试的命令启动, 如下图, idea的配置如下:

nimbus 启动之后会向服务器的5005端口启动一个进程 a, idea随时可以启动remote debug attach到a 进程进行调试

二. 查看日志日志主要看的是worker和nimbus两个, 都在jstormHome/logs下面,

三. 源码解析按照解决思路, 不是关键的代码就一笔带过了, 重点是搞懂rebalance的主要流程, 以及task分配到worker的策略, 目的是尽量保证旧有的 task 分配到worker的策略不变

thriftClient 客户端提交rebalance命令, rebalance.main 方法提交.
nimbus 接受到状态变化, StatusTransition 初始化statusTransitionCallback, 关键是DoRebalanceTransitionCallback, 生成TopologyAssignEvent 推送到 TopologyAssign 处理
后续可以参考这篇文章 [JStorm源码分析系列--02--拓扑分配TopologyAssign,
因为按照解决思路, 尽量保证分配不变, 关键代码来了, 所以在新增task的情况下, 需要保证 changeTaskId只有新增的taskId

按照第四点, 便一直寻找源码里的细节, 修改的两个配置为5,6两点

这个方法会返回所有可用的worker, , 红框标记如果使用 old assignment, 则会保持旧有的taskToWorker的分配策略不变, 在后续如果旧有的worker已经分配了足够的task的情况下, 不会再把task 分配到这些worker(removeWorkerFromSrcPool 方法), 否则如果采用new assignment, 则task 可能会分配到和之前不同的worker. 所以需要配置 use.old.assignment=true.

如果worker的数量小于10, 则不会给topology_master这个task单独分配一个worker, 会导致这个TMTask所在的worker的所有task重分配, 所以配置: topology.master.single.worker=true, 让topology_master 独占一个worker,
经过5.6两点的配置, 在新增task的时候, 的确只有新增的taskId需要进行assign, 其他task保持不变.
nimbus更新完topology的配置之后更新到zk, JStorm 通过这个类来watch zk的event,

9. worker通过这个类来响应task的变化, 进行create或者shutdown

经过5.6两点的配置, 在worker响应task变化时, 也证实了只有新增的task发生了assign,

第一次总结

经过源码解析 5,6两点的配置, 只有新增的task发生了assign, 但是在生产上进行测试的时候还是发现大幅度影响了topology的SendTPS, TPS的图表呈现断崖式下跌, 后续还要再次确认一下新增task 之后做了那些事, 具体的流程有哪些, more TODO

半天之后, 发现现在所有的topic的consumer都在一个consumer group, 新增consumer 会引起整个consumer group 的rebalance, 具体日志见下图,猜测会影响kafka 的性能, (但是只是调整某个kafka topic 的partition数量却只引起了当前topic下面的consumer 的rebalance, 没有影响其他topic ) , 可以把某些topic 拆分到其他的consumer group, 看是否groupA 的调整是否影响groupB, 等待反馈.

第二次总结

把某个spout 拆到其他的consumer group之后, 还是会影响JStorm的TPS, (通过看JStorm的管理界面的图表), 但是已经不引起其他topic的consumer 的rebalance了, 心碎.... 后面想到会不会因为这个topic的消息量很大呢, 然后选择了一个没有消息的topic 拆出来, 发现还是影响了图表, ORZ...

目前结论

关于kafka 同一个consumer group下, 若有consumer 增加, 则会引起所有的consumer 进行reblance, 包括其他topic下面的, 只是改变某个topic repartition的数量, 只是引起当前topic 的consumer 进行rebalance, 不影响其他topic consumer.

后续方向

看kafka的发送速率有没有下降
关闭ack机制, 或者使用exactly-once

Written with StackEdit.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

jstorm-auto-scale-problem.md

jstorm-auto-scale-problem.md

架构

Files

jstorm-auto-scale-problem.md

Latest commit

History

jstorm-auto-scale-problem.md

File metadata and controls

架构