DataX-Web部署和使用
码阁 2024-06-13 10:03:02 阅读 61
目录
一、准备
(一)一台centos 7主机、连网
(二)关闭防火墙
二、jdk安装配置
(一)将jdk安装包上传到opt下或用wget下载将jdk压缩包授权并解压
(二)配置环境变量,在profile最后面添加
(三)让配置生效
(四)查看java版本,执行下面命令出现jdk版本即安装成功
三、mysql5.7安装配置
(一)查找已经安装的mysql安装包
(二)CentOS7下还需要查找是否存在mariadb包:
(三)上述两步骤如果查出了mysql则需要将对应的文件删除
(四)MySQL 安装会通过 MySQL 用户在 /tmp 下建 tmp_db 文件,故需要给 /tmp 目录权限:
(五)依赖库的检查与下载
(六)下载mysql安装包及解压
(七)开始安装,使用 rpm 命令按顺序依次安装 4 个包:
(八)查看是否安装成功
(九)初始化mysql
(十)启动MySQL服务
(十一)登录:
(十二)重启MySQL服务:
(十三)安装好mysql登录,新增数据库,我新增的是kmt,在kmt下创建了table1和table2表;
(十四)给table1新增数据
四、python2.7安装与配置
(一)安装依赖库及python安装包并解压
(二)创建安装文件夹及编译安装
(三)输入python -version显示版本即安装成功
五、datax安装
(一)下载安装datax工具
(二)删除datax/plugin下._的隐藏文件,否则数据读取写入时会报错
(三)修改原job.json文件
(四)进入datax的bin目录下执行python脚本
六、datax-web安装
(一)下载安装datax-web工具安装包并解压
(二)进入/home/datax-web-2.1.2/bin目录启动datax-web
(三)在浏览器访问http://当前主机ip:datax-web端口/index.html
(四)执行器配置
(五)添加数据源
(六)添加项目
(七)创建datax模板
(八)任务构建,读取表的选择
(九)在操作中编辑相关的内容
(十)手动执行一次后,成功后开启任务
七、数据验证
一、准备
(一)一台centos 7主机、连网
(二)关闭防火墙
systemctl stop firewalld.service 关闭防火墙
systemctl disable firewalld.service 禁用防火墙
systemctl status firewalld.service 查看防火墙状态
二、jdk安装配置
(一)将jdk安装包上传到opt下或用wget下载将jdk压缩包授权并解压
wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u131-b11/d54c1d3a095b4ff2b6607d096fa80163/jdk-8u131-linux-x64.rpmchmod +x jdk-8u131-linux-x64.rpmrpm -ivh jdk-8u131-linux-x64.rpm
(二)配置环境变量,在profile最后面添加
vim /etc/profile
export JAVA_HOME=/usr/java/jdk1.8.0_131export JRE_HOME=${JAVA_HOME}/jreexport CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATHexport JAVA_PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin
(三)让配置生效
source /etc/profile
(四)查看java版本,执行下面命令出现jdk版本即安装成功
java -version
三、mysql5.7安装配置
(一)查找已经安装的mysql安装包
rpm -qa|grep mysql
(二)CentOS7下还需要查找是否存在mariadb包:
rpm -qa|grep mariadb
(三)上述两步骤如果查出了mysql则需要将对应的文件删除
(四)MySQL 安装会通过 MySQL 用户在 /tmp 下建 tmp_db 文件,故需要给 /tmp 目录权限:
chmod -R 777 /tmp
(五)依赖库的检查与下载
rpm -qa|grep libaiorpm -qa|grep net-toolsyum -y install libaio net-tools//不存在需下载
(六)下载mysql安装包及解压
wget http://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.16-1.el7.x86_64.rpm-bundle.tartar -xvf mysql-5.7.16-1.el7.x86_64.rpm-bundle.tar
下载解压后会有四个rpm包
mysql-community-common-5.7.16-1.el6.x86_64.rpm
mysql-community-libs-5.7.16-1.el6.x86_64.rpm
mysql-community-client-5.7.16-1.el6.x86_64.rpm
mysql-community-server-5.7.16-1.el6.x86_64.rpm
(七)开始安装,使用 rpm 命令按顺序依次安装 4 个包:
rpm -ivh mysql-community-common-5.7.16-1.el7.x86_64.rpm
rpm -ivh mysql-community-libs-5.7.16-1.el7.x86_64.rpm
rpm -ivh mysql-community-client-5.7.16-1.el7.x86_64.rpm
rpm -ivh mysql-community-server-5.7.16-1.el7.x86_64.rpm
(八)查看是否安装成功
mysqladmin –version
(九)初始化mysql
mysqld --initialize --user=mysql
这里会产生一个mysql的临时密码,一定要复制出来,如果忘记了可以查看我的关于忘记MySQL的博客
(十)启动MySQL服务
systemctl start mysqld.service
systemctl stop mysqld.service
systemctl status mysqld
systemctl list-unit-files|grep mysqld.service
(十一)登录:
首次登录需用前面生成的临时密码mysql -uroot -p 临时密码,临时密码重启mysql就改变了,故需要修改为固定的密码:
ALTER USER 'root'@'localhost' IDENTIFIED BY 'new_password';
若设置密码太短等因素导致修改不成功,则修改以下参数
set global validate_password_policy=LOW; // 设置密码的验证强度等级为低(LOW)set global validate_password_length=6; // 设置密码长度为6,最小为4
添加用户、设置字符集等就不在一一介绍了
(十二)重启MySQL服务:
systemctl restart mysqld
(十三)安装好mysql登录,新增数据库,我新增的是kmt,在kmt下创建了table1和table2表;
ceate database kmt;use kmt;CREATE TABLE `table1` (`id` int(10) NULL DEFAULT NULL,`name` varchar(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL) ENGINE = InnoDB CHARACTER SET = utf8mb4 COLLATE = utf8mb4_general_ci ROW_FORMAT = Dynamic;CREATE TABLE `table2` (`id` int(10) NULL DEFAULT NULL,`name` varchar(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL) ENGINE = InnoDB CHARACTER SET = utf8mb4 COLLATE = utf8mb4_general_ci ROW_FORMAT = Dynamic;
(十四)给table1新增数据
table2
四、python2.7安装与配置
(一)安装依赖库及python安装包并解压
yum install gcc g++ zlib zlib-devel openssl-develwget https://www.python.org/ftp/python/2.7/Python-2.7.tgztar -zxvf Python-2.7.14.tgz
(二)创建安装文件夹及编译安装
#创建安装文件夹mkdir /usr/local/pythoncd Python-2.7.14./configure --prefix=/usr/local/python/make && make install
安装完成之后进入目录,里面显示4个目录bin
include
lib
share
(三)输入python -version显示版本即安装成功
五、datax安装
(一)下载安装datax工具
wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
(二)删除datax/plugin下._的隐藏文件,否则数据读取写入时会报错
rm -rf /usr/local/datax/plugin/*/._*
(三)修改原job.json文件
{ "job": { "content": [ { "reader": { "name": "mysqlreader", "parameter": { "username": "数据库用户", "password": "数据库密码", "column": [//表中的字段 "id", "name" ], "connection": [ { "table": [ "对应的表" ], "jdbcUrl": [ "jdbc:mysql://ip/要读取的数据库?characterEncoding=utf8" ] } ] } }, "writer": { "name": "mysqlwriter", "parameter": { "username": "数据库用户", "password": "数据库密码", "column": [//对应的字段 "id", "name" ], "connection": [ { "table": [ "对应的表" ], "jdbcUrl": "jdbc:mysql://ip/要写入的表?characterEncoding=utf8" } ] } } } ], "setting": { "speed": { "channel": 1, "byte": 104857600 }, "errorLimit": { "record": 10, "percentage": 0.05 } } }}
(四)进入datax的bin目录下执行python脚本
python datax.py ../job/job.json
六、datax-web安装
(一)下载安装datax-web工具安装包并解压
(二)进入/home/datax-web-2.1.2/bin目录启动datax-web
./stop-all.sh 停止./start-all.sh 启动
(三)在浏览器访问http://当前主机ip:datax-web端口/index.html
(四)执行器配置
(五)添加数据源
(六)添加项目
(七)创建datax模板
(八)任务构建,读取表的选择
写入表的选择
字段映射,勾选两表的全部字段
选择模板
构建
(九)在操作中编辑相关的内容
(十)手动执行一次后,成功后开启任务
七、数据验证
查看table2中已经同步了table1中的数据
测试设置的时间,到时间是会不会自动同步
table1
table2
任务已经开启,到时间查看已将table1新添加的数据同步到table2
上一篇: 【2024最新】jetbrains全家桶解锁(PyCharm,IntelliJ IDEA,PhpStorm,RubyMine,WebStorm)一键激活永久使用
下一篇: 【Web世界探险家】打开Web世界的大门
本文标签
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。