小编典典

插入Hive表中的值并用双引号将csv文件中的字符串

sql

我正在将一个csv文件导出到配置单元表中。关于csv文件:列值包含在双引号中,并用逗号分隔。

CSV的样本记录

"4","good"
"3","not bad"
"1","very worst"

我使用以下语句创建了一个配置单元表,

创建外部表咖喱(review_rating string,review_comment string)行格式字段,以',';分隔

表已创建。

现在,我使用命令load data local inpath加载了数据,并且操作成功。当我查询表格时,

select * from currys;

结果是:

"4"  "good"
"3"  "not bad"
"1"   "very worst"

代替

4  good
3  not bad
1  very worst

记录中插入的双引号不应该是双引号。

请让我知道如何消除此双引号..任何帮助或指导都受到高度赞赏…

预先感谢!


阅读 189

收藏
2021-04-28

共1个答案

小编典典

你在用serde吗?如果是这样,则可以在中编写regex命令SERDE PROPERTIES以删除引号。

或者,您可以在此处使用csv- serdefrom并定义。quote character

2021-04-28