Sqoop介绍
1 | sqoop是一款数据转换工具,主要用于在Hadoop(hive)与传统的数据库之间进行数据传递。 |
- 官方网址-Apache Sqoop
- 使用文档-Apache Sqoop
1 | 截止目前共计2个版本,选择其一即可: |
解压并配置环境变量
1 | tar -zxf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt |
配置环境变量 /etc/profile
1 | export SQOOP_HOME=/opt/sqoop-1.4.7 |
1 | source /etc/profile |
验证
1 | [root@master1 ~]# sqoop-version |
导入MySQL JAR包
1 | 因为稍后会使用sqoop将操作MySQL数据到HDFS,所以,需要使用与MySQL版本一致的对应Jar包。 |
MySQL Connector/J: 下载
1 | unzip mysql-connector-java-5.1.46.zip |
sqoop导入导出-说明
导入
1 | - 读数据(一行一行的读,即row by row) |
导出
1 | 将HDFS上的文件导出到关系型数据库指定的库或指定的组中 |
查看导入/导出的数据库的情况
1 | - 库 sqoop-list-databases |
自定义导入/导出
1 | - 导入过程(可以导入/导出某个库某张表特定的行或列、或指定分隔符...) |
sqoop-help命令帮助
1 | Available commands: |
sqoop工具使用
1 | sqoop针对不同的需求开发出了不同的工具,故可以将sqoop理解为是一个工具箱。 |
查看具体某个命令(以import命令为例)的使用帮助
1 | sqoop help import |
- 本文作者: GaryWu
- 本文链接: https://garywu520.github.io/2019/03/08/Mars-Hadoop-Sqoop介绍及安装/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!