sqoop 同步Teradata数据到hive,解决中文乱码问题

把以下驱动文件放到目录:/opt/cloudera/parcels/CDH-5.4.5-1.cdh5.4.5.p0.7/lib/sqoop/lib

  1. tdgssconfig-15.10.00.9.jar
  2. terajdbc4-15.10.00.9.jar

执行语句如下:

   sqoop import --connect jdbc:teradata://192.168.1.101/CLIENT_CHARSET=EUC_CN,TMODE=TERA,CHARSET=ASCII,DATABASE=CN_WC_VM  --username xxxx --password xxx \
 --query " select top 100 * from CN_WC_VM.ITEM_DESC_ASCII where  \$CONDITIONS " --m 1 --target-dir /ecommerce/ITEM_DESC  --fields-terminated-by '\001' --lines-terminated-by '\n' \
 --hive-import --hive-overwrite --hive-database fresh  --hive-table ITEM_DESC15 --driver com.teradata.jdbc.TeraDriver  \
 --delete-target-dir --hive-drop-import-delims

解决中文乱码的问题主要是设置以下参数:

CLIENT_CHARSET=EUC_CN,TMODE=TERA,CHARSET=ASCII

Be the first to comment

Leave a Reply

Your email address will not be published.


*