我正在将一个csv文件导出到配置单元表中。关于csv文件:列值包含在双引号中,并用逗号分隔。
CSV的样本记录
"4","good" "3","not bad" "1","very worst"
我使用以下语句创建了一个配置单元表,
创建外部表咖喱(review_rating string,review_comment string)行格式字段,以',';分隔
','
表已创建。
现在,我使用命令load data local inpath加载了数据,并且操作成功。当我查询表格时,
select * from currys;
结果是:
"4" "good" "3" "not bad" "1" "very worst"
代替
4 good 3 not bad 1 very worst
记录中插入的双引号不应该是双引号。
请让我知道如何消除此双引号..任何帮助或指导都受到高度赞赏…
预先感谢!
你在用serde吗?如果是这样,则可以在中编写regex命令SERDE PROPERTIES以删除引号。
serde
regex
SERDE PROPERTIES
或者,您可以在此处使用csv- serdefrom并定义。quote character
csv- serde
quote character