在Scala中,我可以执行操作get(#)或getAs[Type](#)从数据框中获取值。我应该怎么做pyspark?
get(#)
getAs[Type](#)
pyspark
我有两列DataFrame:item(string)和salesNum(integers)。我做了groupby,并mean得到一个是说像这样的数字:
item(string)
salesNum(integers)
groupby
mean
saleDF.groupBy("salesNum").mean()).collect()
而且有效。现在,我在具有一个值的数据框中具有均值。
如何从数据框中获取该值,以将平均值作为浮点数?
collect()以python列表的形式返回结果。要从列表中获取值,您只需要采用以下第一个元素:
collect()
saleDF.groupBy("salesNum").mean()).collect()[0]