MySQL中Datax如何实现离线数据抽取

68次阅读
没有评论

共计 2488 个字符,预计需要花费 7 分钟才能阅读完成。

这篇文章将为大家详细讲解有关 MySQL 中 Datax 如何实现离线数据抽取,丸趣 TV 小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

Datax 下载地址:https://github.com/alibaba/DataX

Datax MySQL 读:
https://github.com/alibaba/DataX/blob/master/mysqlreader/doc/mysqlreader.md

Datax MySQL 写:
https://github.com/alibaba/DataX/blob/master/mysqlwriter/doc/mysqlwriter.md

1. 下载安装 Datax 软件 (必须安装 jdk 1.8 版本以上)

[root@localhost ~]# tar xvf jdk-8u65-linux-x64.tar.gz

[root@localhost ~]# mv jdk1.8.0_151  /usr/local/jdk1.8.0_151

[root@localhost ~]# vim /etc/profile

export PATH=$PATH:/usr/local/jdk1.8.0_151/bin

[root@localhost ~]# vim /etc/ld.so.conf.d/mysql-x86_64.conf

/usr/local/jdk1.8.0_151/lib

[root@localhost ~]# tar xvf datax.tar.gz

[root@localhost ~]# cd datax/job/

2. 编辑配置文件

[root@localhost job]# vim job.json

{

    job : {

        setting : {

            speed : {

                channel : 5

            }

        },

        content : [

            {

                reader : {

                    name : mysqlreader ,

                    parameter : {

                        username : taf ,

                        password : taf2015 ,

                        column : [*],

                        connection : [

                           {

                              table : [t2],

                              jdbcUrl : [jdbc:mysql://172.16.8.160:3306/test?useUnicode=true characterEncoding=utf8]

                           }

                        ]

                    }

                },

                writer : {

                    name : mysqlwriter ,

                    parameter : {

                        writeMode : update ,

                        username : wangying ,

                        password : wangying ,

                        column : [*],

                        connection : [

                            {

                                jdbcUrl : jdbc:mysql://172.16.8.93:3306/db_stktag ,

                                table : [t2]

                            }

                        ]

                      }

                    }

                }

        ]

    }

}

[root@localhost job]# 

3.mysql 两边表结果必须一至,使用 python2 抽取数据

[root@localhost job]# python2 /root/datax/bin/datax.py job.json

DataX (DATAX-OPENSOURCE-3.0), From Alibaba !

Copyright (C) 2010-2017, Alibaba Group. All Rights Reserved.

2019-01-29 11:18:50.569 [main] INFO  VMInfo – VMInfo# operatingSystem class = sun.management.OperatingSystemImpl

2019-01-29 11:18:50.615 [main] INFO  Engine – the machine info  =  

osInfo:Oracle Corporation 1.8 25.151-b12

jvmInfo:Linux amd64 3.10.0-123.el7.x86_64

cpu num:8

totalPhysicalMemory:-0.00G

freePhysicalMemory:-0.00G

maxFileDescriptorCount:-1

currentOpenFileDescriptorCount:-1

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

任务启动时刻                     : 2019-01-29 11:18:50

任务结束时刻                     : 2019-01-29 11:19:04

任务总计耗时                     :                 13s

任务平均流量                     :                1B/s

记录写入速度                     :              0rec/s

读出记录总数                     :                   7

读写失败总数                     :                   0

[root@localhost job]#

关于“MySQL 中 Datax 如何实现离线数据抽取”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-27发表,共计2488字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)