Skip to content

dengmin/DataX-Masking

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Data-Masking

Data-Masking 是在 [DataX 3.0] (https://github.com/alibaba/DataX/)框架基础上二次开发得到的**数据脱敏平台**,可以快速地在数据传输过程中对指定的单个或多个字段用可选的脱敏方法进行处理。

Features

DataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的Reader插件,以及向目标端写入数据的Writer插件,理论上DataX框架可以支持任意数据源类型的数据同步工作。同时DataX插件体系作为一套生态系统, 每接入一套新数据源该新加入的数据源即可实现和现有的数据源互通。

Data-Masking 通过扩展DataX的transformer中间件,集成了多种脱敏算法,主要包括:epsilon差分隐私保护,保型加密,MD5摘要算法,AES加密,RSA非对称加密等。

详细使用方法请参考 transformer介绍文档

DataX详细介绍

请参考:DataX-Introduction

Quick Start

请点击:Quick Start

Support Data Channels

DataX目前已经有了比较全面的插件体系,主流的RDBMS数据库、NOSQL、大数据计算系统都已经接入,目前支持数据如下图,详情请点击:DataX数据源参考指南

类型 数据源 Reader(读) Writer(写) 文档
RDBMS 关系型数据库 MySQL
            Oracle         √         √    
SQLServer
PostgreSQL
DRDS
达梦
通用RDBMS(支持所有关系型数据库)
阿里云数仓数据存储 ODPS
ADS
OSS
OCS
NoSQL数据存储 OTS
Hbase0.94
Hbase1.1
MongoDB
Hive
无结构化数据存储 TxtFile
FTP
HDFS
Elasticsearch

我要开发新的插件

请点击:DataX插件开发宝典

Data-Masking Contributor

  • Liu Kun
  • Liu Wenyan
  • Wang hao
  • Liu Jiaye

License

This software is free to use under the Apache License Apache license.

About

DataX 3.0 平台上脱敏算法的集成与实现。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Java 95.8%
  • Python 4.1%
  • Shell 0.1%