Slack Channel
Discussions
English version

介绍

FEDB是一个面向在线推理和决策应用的NewSQL数据库。这些应用通过预先训练好的模型从多个时间窗口中提取实时特征用于在线预估和决策。用现有的数据库耗时在几百毫秒甚至到秒级别不能满足在线推理和决策的实时性要求。FEDB使用双层跳表的内存数据结构和对SQL进行极致地编译优化能够大幅降低延时。

高性能

FEDB比SingleStore和SAP HANA快一到两个数量级。
SQL兼容

兼容大部分ANSI SQL语法，有python和java client。其中java client支持大部分JDBC接口。
在线离线一致性

使用FEDB开发的机器学习应用可以一键上线，并且保证在线离线一致性，大大降低了机器学习场景的落地成本。
支持分布式，易扩展

支持故障自动切换，支持横向扩展。

注:目前还处于unstable状态并且有许多功能待补齐，不能运用于生产环境。

架构

参考这里

快速开始

在Linux平台构建

docker pull 4pdosc/centos6_gcc7_hybridsql:0.1.1
git clone https://github.com/4paradigm/fedb.git
cd fedb
docker run -v `pwd`:/fedb -it 4pdosc/centos6_gcc7_hybridsql:0.1.1
cd /fedb
sh steps/init_env.sh
mkdir -p build && cd build && cmake ../ && make -j5 fedb

典型应用场景

出租车线路耗时预测
在线交易系统健康检测和预警
在线交易反欺诈

性能测试

在AI场景中大部分实时特征是时序相关的需要通过多个时间窗口计算。我们用常见的求TopN作为测试场景。

测试环境

机器配置:

配置项	值
CPU型号	Intel Xeon Platinum 8280L
内存	384 GB
操作系统	CentOS-7 with kernel 5.1.9-1.el7

测试结果

测试结果表明FEDB比SingleStore和SAP HANA快了一到两个数量级。更多测试结果请参考VLDB'21 paper。

未来规划

ANSI SQL兼容

FEDB目前已经兼容主流DDL、DML语法，并逐步增强ANSI SQL语法的兼容性。

[2021H1] 完善Window的标准语法，支持Where, Group By, Join等操作
[2021H1&H2]针对AI场景扩展特有的语法特性和UDAF函数

功能/性能提升

为了满足实时推理与决策场景的高性能需求，FEDB选择内存作为存储引擎介质，而目前业界使用内存存储引擎都存在内存碎片和重启恢复效率问题，FEDB计划对内存分配算法进行优化降低碎片问题以及引入PMEM(Intel Optane DC Persistent Memory Module)存储介质提升数据恢复效率，具体计划如下：

[2021H1]支持新内存分配策略，降低内存碎片问题
[2021H2]实验支持PMEM存储引擎

生态构建

FEDB有java/python client，java client支持JDBC接口的大部分功能。未来会对接到大数据生态，让Flink/Kafka/Spark与FEDB更方便集成。

[2021H1&H2]支持Flink/Kafka/Spark connector

反馈和参与

bug、疑惑、修改欢迎提在Github Issues
想了解更多或者有想法可以参与到slack交流

许可证

Apache License 2.0

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_cn.md

README_cn.md

介绍

架构

快速开始

在Linux平台构建

典型应用场景

性能测试

测试环境

测试结果

未来规划

ANSI SQL兼容

功能/性能提升

生态构建

反馈和参与

许可证

Files

README_cn.md

Latest commit

History

README_cn.md

File metadata and controls

介绍

架构

快速开始

在Linux平台构建

典型应用场景

性能测试

测试环境

测试结果

未来规划

ANSI SQL兼容

功能/性能提升

生态构建

反馈和参与

许可证