3
我是一名初学者,我尝试提出请求让我检索访问量最大的网页。Spark request max count
我的要求是以下
mostPopularWebPageDF = logDF.groupBy("webPage").agg(functions.count("webPage").alias("cntWebPage")).agg(functions.max("cntWebPage")).show()
有了这个请求,我只检索与最大计数一个数据帧,但我想检索与此分数和网页保存一个数据帧这个分数
类似的东西:
webPage max(cntWebPage)
google.com 2
我该如何解决我的问题?
非常感谢。
非常感谢您的帮助:) – JackR
@JackR如果它对您有帮助,请将uptove +标记为接受:) –
我对此投票,因为OP似乎对如何处理事情毫无头绪。 :) – eliasah