博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
sqoop详解
阅读量:6292 次
发布时间:2019-06-22

本文共 1004 字,大约阅读时间需要 3 分钟。

版本 1.4.3

sqoop help 命令帮助

对应数据库的jdbc jar包复制到sqoop lib目录下

1.把数据从mysql导入hdfs(默认是/user/<username>中

sqoop import --connect  jdbc:mysql://localhost:3306/hive --username root --password root --table  TBLS --fields-terminated-by  '\t'  --null-string '**'  -m 1 --append

m代表map个数

append代表追加,目录存在的情况下

--hive-import代表导入到hive中

2.把数据从hdfs导出到mysql都是按目录导出(mysql事先要存在一个数据库和表)

sqoop export --connect  jdbc:mysql://localhost:3306/hive --username root --password root --table  ids --fields-terminated-by  '\t'  --export-dir '/ids'

可以重复执行不断往mysql中插入

3.增量导入,生产中用的比较多(incremental)

--check-column 'TBL_ID'  --incremental append --last-value 6

4.设置作业

创建job(类似于脚本)

sqoop job --create  myjob -- import --connect  jdbc:mysql://localhost:3306/hive --username root --password root --table  TBLS --fields-terminated-by  '\t'  --null-string '**'  -m 1 --append

查看job

sqoop job --list

删除job

sqoop job --delete myjob

执行job

sqoop job --exec myjob

需要输入密码

5.导入导出的事务是以Mapper任务为单位

--satging-table中间表

staging-table <staging-table-name> 中间表

本文出自 “” 博客,请务必保留此出处

转载地址:http://iajta.baihongyu.com/

你可能感兴趣的文章
一些通用性的haproxy调优tips
查看>>
Java中泛型的各种使用
查看>>
这些git技能够你用一年了
查看>>
Android开发学习之路--Notification之初体验
查看>>
用友ERP T6技术解析(六) 库龄分析
查看>>
uva 10401 Injured Queen Problem(dp)
查看>>
[LeetCode] Kth Smallest Element in a BST
查看>>
rxlib簡介
查看>>
PEAR安装、管理及使用
查看>>
iOS 6.1完美越狱教程
查看>>
Android Studio无法打开解决方法
查看>>
消息头字段
查看>>
ArrayList和数组间的相互转换
查看>>
微信公众平台——自定义菜单
查看>>
[转]SQL truncate 、delete与drop区别
查看>>
软件的价值
查看>>
一种用户体验-显示对话框时灰化你的主窗体
查看>>
免费超高速卡片式病人基本信息列表控件
查看>>
HDU 3336 Count the string(KMP+DP)
查看>>
WebGame 客户端 美术资源处理之PNG批量导出SWF
查看>>