Elasticsearch-datatran v6.1.0發佈，Elasticsearch數據同步工具頭條網

Elasticsearch-datatran v6.1.0發佈，Elasticsearch數據同步工具

2020-12-14 09:10:28 佚名

Elasticsearch 數據同步工具 Elasticsearch-datatran 6.1.0 發佈，Elasticsearch-datatran 是由 bboss 開源的一款將各種數據源中的海量數據同步到 Elasticsearch 的高效數據同步工具。

Elasticsearch-datatran v6.1.0發佈，Elasticsearch數據同步工具

v6.1.0功能改進

如果在程序裡面配置的增量字段類型發生改變，要把增量狀態表對應的類型調整為最新的字段類型設置了類型後，就按照類型來，不再按照設置的日期和數字字段名稱來區分：增加setLastValueColumn方法，廢棄setDateLastValueColumn和setNumberLastValueColumn兩個方法
DB-DB數據同步工具：增加在作業中直接指定sql語句的功能
修復數據同步bug：數據庫到數據庫跨庫同步無效
可以通過ImportBuilder組件設置geoip數據庫地址，使用案例： importBuilder.setGeoipDatabase("E:/workspace/hnai/terminal/geolite2/GeoLite2-City.mmdb"); importBuilder.setGeoipAsnDatabase("E:/workspace/hnai/terminal/geolite2/GeoLite2-ASN.mmdb");

5.數據同步增加db-db數據同步spring boot案例工程：

https://github.com/bbossgroups/db-db-job

Elasticsearch-datatran功能特點

1.支持多種數據源之間的數據同步

數據庫表數據同步到Elasticsearch

數據庫表數據同步到數據庫表
Elasticsearch數據同步到數據庫表
Elasticsearch數據同步到Elasticsearch
Mongodb數據同步到Elasticsearch
Mongodb數據同步到數據庫表
從Kafka接收數據並導入Elasticsearch
增刪改數據同步到elasticsearch
HBase數據同步到Elasticsearch

2.支持增刪改數據同步

3.支持多種數據導入方式

批量數據導入
批量數據多線程並行導入
定時全量（串行/並行）數據導入
定時增量（串行/並行）數據導入

4.支持的數據庫和消息中間件類型

數據庫： mysql,maridb，postgress,oracle ,sqlserver,db2,tidb,hive，mongodb、HBase、elasticsearch、達夢等

消息中間件：kafka 1x,kafka 2x

5.Elasticsearch版本兼容性

Elasticsearch 1.x,2.x,5.x,6.x,7.x,+

6.支持海量PB級數據同步導入Elasticsearch

7.支持將ip轉換為對應的運營商/省份城市/經緯度座標位置信息

8.支持設置數據bulk導入任務結果處理回調函數，對每次bulk任務的結果進行成功和失敗反饋，然後針對失敗的bulk任務通過error和exception方法進行相應處理

9.支持多種定時任務執行引擎

jdk timer （內置）
quartz
xxl-job分佈式調度引擎，基於分片調度機制實現海量數據快速同步能力

10.基於java語言開發和發佈數據同步作業

bboss elasticsearch數據同步工具另一個顯著的特色就是直接基於java語言來編寫數據同步作業程序，基於強大的java語言和第三方工具包，能夠非常方便地加工和處理需要同步的源數據，然後將最終的數據保存到目標庫（Elasticsearch或者數據庫）；同時也可以非常方便地在idea或者eclipse中調試和運行同步作業程序，調試無誤後，通過bboss提供的gradle打包構建腳本，即可發佈出可部署到生產環境的同步作業包。

11.支持兩種作業運行方式