`

Sqoop 安装使用

阅读更多
sqoop是一款开源的工具,主要用于hfds/hive和传统关系型数据库(mysql,postgresql....)之间的数据的迁移
1、安装:只要在集群中的一台机器上安装sqoop就可以使用了,经常使用的话讲sqoop加入到环境变量中
将mysql的驱动jar包拷贝到sqoop/lib下面
2、常用命令:
第一类:
数据库中的数据导入到HDFS上
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123  --table trade_detail --columns 'id, account, income, expenses'
指定输出路径、指定数据分隔符
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123  --table trade_detail --target-dir '/sqoop/td' --fields-terminated-by '\t'
指定Map数量 -m
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123  --table trade_detail --target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2
增加where条件, 注意:条件必须用引号引起来
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123  --table trade_detail --where 'id>3' --target-dir '/sqoop/td2'
增加query语句(使用 \ 将语句换行)
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123 --query 'SELECT * FROM trade_detail where id > 2 AND $CONDITIONS' --split-by trade_detail.id --target-dir '/sqoop/td3'
注意:如果使用--query这个命令的时候,需要注意的是where后面的参数,AND $CONDITIONS这个参数必须加上
而且存在单引号与双引号的区别,如果--query后面使用的是双引号,那么需要在$CONDITIONS前加上\即\$CONDITIONS
如果设置map数量为1个时即-m 1,不用加上--split-by ${tablename.column},否则需要加上
第二类:
将HDFS上的数据导出到数据库中(不要忘记指定分隔符)
sqoop export --connect jdbc:mysql://192.168.8.120:3306/db --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ','
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics