infobright中导入数据避免特殊字符问题

WBOY
发布: 2016-06-07 16:42:27
原创
936 人浏览过

目前在用的是社区版的infobright,不支持DML功能,只能用LOAD DATA方式导入数据。 如果元数据中有特殊控制字符,导入过程中经常会报错,很是恼火。应对策略有两种方法: 设置Reject File导入之前,设定@BH_REJECT_FILE_PATH 和@BH_ABORT_ON_COUNT 就可以忽略

目前在用的是社区版的infobright,不支持DML功能,只能用LOAD DATA方式导入数据。

如果元数据中有特殊控制字符,导入过程中经常会报错,很是恼火。应对策略有两种方法:

  • 设置Reject File导入之前,设定@BH_REJECT_FILE_PATH 和@BH_ABORT_ON_COUNT 就可以忽略多少条导入失败的记录,并且将这些记录保存在指定文件 /**当拒绝的行数达到10时,中止进程**/ set @BH_REJECT_FILE_PATH = '/tmp/reject_file'; set @BH_ABORT_ON_COUNT = 10; BH_ABORT_ON_COUNT 设定为 -1 的话,表示永不忽略。

    也可以设置BH_ABORT_ON_THRESHOLD 选项,该选项表示有最多多少百分比的数据允许被忽略,因此该选项的值是小数格式,例如BH_ABORT_ON_THRESHOLD = 0.03(表示3%)

  • 导出时指定结束符此外,还可以在导出数据时制定结束符,并且设定忽略哪些转义字符(、”、’ 等字符),例如:
  • select fields_list... into outfile '/tmp/outfile.csv' fields terminated by '||' ESCAPED BY '\'lines terminated by 'rn' from mytable;
  • 或者,将行间隔符设定为其他特殊标识,例如:select fields_list… into outfile ‘/tmp/outfile.csv’ fields terminated by ‘||’ ESCAPED BY ‘\’lines terminated by ‘$$$$$rn’ from mytable;当然了,这种情况下,实际数据行中就不能存在 “$$$$$rn” 这个值了,否则会被当成换行标识。

 


相关标签:
来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!