Stars
Highly configurable JSON format logging per Location - nginx logging module - aka. kasha 🍲
The Metadata Platform for your Data and AI Stack
Source-agnostic distributed change data capture system
A connector for Spark that allows reading and writing to/from Redis cluster
Ryochan7 / DS4Windows
Forked from Jays2Kings/DS4WindowsLike those other ds4tools, but sexier
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
Example programs and scripts for accessing parquet files
基于inception的自动化SQL操作平台,支持SQL执行、LDAP认证、发邮件、OSC、SQL查询、SQL优化建议、权限管理等功能,支持docker镜像
Spark structured streaming with Kafka data source and writing to Cassandra
Spark Structured Streaming / Kafka / Cassandra / Elastic
DataLink是一个满足各种异构数据源之间的实时增量同步、离线全量同步,分布式、可扩展的数据交换平台。
🚁🚀基于Flink实现的商品实时推荐系统。flink统计商品热度,放入redis缓存,分析日志信息,将画像标签和实时记录放入Hbase。在用户发起推荐请求后,根据用户画像重排序热度榜,并结合协同过滤和标签两个推荐模块为新生成的榜单的每一个产品添加关联产品,最后返回新的用户列表。
The Apache Spark - Apache HBase Connector is a library to support Spark accessing HBase table as external data source or sink.
The Internals of Spark Structured Streaming
Apache DolphinScheduler is the modern data orchestration platform. Agile to create high performance workflow with low-code
CMAK is a tool for managing Apache Kafka clusters
基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生flink SQL所有的语法
A web front end for an elastic search cluster
Repo for counting stars and contributing. Press F to pay respect to glorious developers.
DRPC-Proxy是基于使用storm DRPC的RPC服务,解耦业务代码与storm框架代码的一个简单框架; 在某些场景下,有使用DRPC但不注重使用storm的流式计算的需求,通常情况下使用DRPCServer做为服务提供方接收请求,bolt中处理业务,ReturnResults返回结果;bolt中会将业务代码与storm代码交织、耦合,为后期升级、扩展留下难题。 DRPC-Proxy…
一款简单易用的Kettle调度监控平台,专门用来调度和监控由kettle客户端创建的job和transformation。整体的框架是由spring+sprin gmvc +beetlsql整合而成,通过调用kettle的API来执行转换和作业,并且使用quartz框架完成调度工作。
Not Just A Notepad! (golang + mongodb) http://leanote.org
Pentaho Data Integration ( ETL ) a.k.a Kettle