added README.md

gitter-badger · Aug 6, 2017 · 8cfaed9 · 8cfaed9
1 parent c92951d
commit 8cfaed9
Showing 1 changed file with 65 additions and 0 deletions.
diff --git a/README.md b/README.md
@@ -0,0 +1,65 @@
+# Waterdrop
+
+Waterdrop 是一个非常易用，高性能，能够应对海量数据的实时数据处理产品，构建于Apache Spark之上。
+
+## 为什么我们需要 Waterdrop
+
+Databricks 开源的 Apache Spark 对于分布式数据处理来说是一个伟大的进步。我们在使用 Spark 时发现了很多可圈可点之处，同时我们也发现了我们的机会 —— 通过我们的努力让Spark的使用更简单，更高效，并将业界和我们使用Spark的优质经验固化到Waterdrop这个产品中，明显减少学习成本，加快分布式数据处理能力在生产环境落地。
+"Waterdrop" 的中文是“水滴”，来自中国当代科幻小说作家刘慈欣的《三体》系列，它是三体人制造的宇宙探测器，会反射几乎全部的电磁波，表面绝对光滑，温度处于绝对零度，全部由被强互作用力紧密锁死的质子与中子构成，无坚不摧。在末日之战中，仅一个水滴就摧毁了人类太空武装力量近2千艘战舰。
+
+## Waterdrop 的特性
+
+* 简单易用，灵活配置，无需开发
+* 高性能
+* 海量数据处理能力
+* 模块化和插件化，易于扩展
+* 支持spark 1.6 ～ spark 2.x
+
+## Waterdrop 的工作流程
+
+input[数据源输入] -> serializer[数据反序列化] -> filter[数据处理] -> serializer[数据序列化] -> output[结果输出]
+
+## Waterdrop 支持的插件
+
+* Input plugin
+
+Hdfs, Http, Kafka, Redis, Stdin, Tcp
+自行开发的Input plugin
+
+* Filter plugin
+
+Clone, Date, Dict, Drop, Geoip, Grok, Kv, Prune, Range, Split, SQL
+自行开发的Filter plugin
+
+* Output plugin
+
+Elasticsearch, File, Hdfs, Http, Kafka, Mongodb, MySQL, Stdout
+自行开发的Output plugin
+
+* Serializer plugin
+
+Carbondata, Csv, Json, ORC, Parquet, Protobuf, Raw
+自行开发的Serializer plugin
+
+## 配置
+
+[Waterdrop 配置](./docs/english/index.md)
+
+## 部署和测试
+
+## 性能调优
+
+## 开发者指引
+
+## Roadmap
+
+## 贡献观点和代码
+
+提交问题和建议：https://github.com/InterestingLab/waterdrop/issues
+
+贡献代码：https://github.com/InterestingLab/waterdrop/pulls
+
+## 开发者
+
+感谢[所有开发者](https://github.com/InterestingLab/waterdrop/graphs/contributors)
+