Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
bin		bin
config		config
docs/english		docs/english
project		project
src/main/scala/org/interestinglab/waterdrop		src/main/scala/org/interestinglab/waterdrop
.gitignore		.gitignore
README.md		README.md
build.md		build.md
build.sbt		build.sbt
scalastyle-config.xml		scalastyle-config.xml

Repository files navigation

Waterdrop

Waterdrop 是一个非常易用，高性能，能够应对海量数据的实时数据处理产品，构建于Apache Spark之上。

为什么我们需要 Waterdrop

Databricks 开源的 Apache Spark 对于分布式数据处理来说是一个伟大的进步。我们在使用 Spark 时发现了很多可圈可点之处，同时我们也发现了我们的机会 —— 通过我们的努力让Spark的使用更简单，更高效，并将业界和我们使用Spark的优质经验固化到Waterdrop这个产品中，明显减少学习成本，加快分布式数据处理能力在生产环境落地。

"Waterdrop" 的中文是“水滴”，来自中国当代科幻小说作家刘慈欣的《三体》系列，它是三体人制造的宇宙探测器，会反射几乎全部的电磁波，表面绝对光滑，温度处于绝对零度，全部由被强互作用力紧密锁死的质子与中子构成，无坚不摧。在末日之战中，仅一个水滴就摧毁了人类太空武装力量近2千艘战舰。

Waterdrop 使用场景

海量数据实时ETL
海量数据实时聚合
多源数据处理

Waterdrop 的特性

简单易用，灵活配置，无需开发
实时、高性能
海量数据处理能力
模块化和插件化，易于扩展
支持利用SQL做数据处理和聚合
支持spark 1.6 ～ spark 2.x

Waterdrop 的工作流程

input[数据源输入] -> serializer[数据反序列化] -> filter[数据处理] -> serializer[数据序列化] -> output[结果输出]

Waterdrop 支持的插件

Input plugin

Hdfs, Http, Kafka, Redis, Stdin, Tcp, 自行开发的Input plugin

Filter plugin

Aggregate, Clone, Date, Dict, Drop, Geoip, Grok, Kv, Prune, Range, Split, SQL, 自行开发的Filter plugin

Output plugin

Elasticsearch, File, Hdfs, Http, Kafka, Mongodb, MySQL, Stdout, 自行开发的Output plugin

Serializer plugin

Carbondata, Csv, Json, ORC, Parquet, Protobuf, Raw, 自行开发的Serializer plugin

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Waterdrop

为什么我们需要 Waterdrop

Waterdrop 使用场景

Waterdrop 的特性

Waterdrop 的工作流程

Waterdrop 支持的插件

配置

部署和测试

性能调优

开发者指引

Roadmap

贡献观点和代码

开发者

联系项目负责人

About

Releases

Packages

Languages

gitter-badger/waterdrop

Folders and files

Latest commit

History

Repository files navigation

Waterdrop

为什么我们需要 Waterdrop

Waterdrop 使用场景

Waterdrop 的特性

Waterdrop 的工作流程

Waterdrop 支持的插件

配置

部署和测试

性能调优

开发者指引

Roadmap

贡献观点和代码

开发者

联系项目负责人

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages