2016-11-09 116 views
3

什么是强类型API和Spark类型的非类型化API?Spark数据集 - 强类型

数据集如何与DataFrames相似/不相似?

+0

任何人都可以请回答这个问题。 –

+0

链接解释了数据集和数据框之间的差异。 http://stackoverflow.com/questions/31508083/difference-between-dataframe-and-rdd-in-spark/39033308?noredirect=1#comment68807827_39033308 –

回答

2

Dataframe API是非类型化的API,因为只有在运行时才能知道类型。数据集API是类型化的API,在编译期间将知道类型。

df.select("device").where("signal > 10")  // using untyped APIs 
ds.filter(_.signal > 10).map(_.device)   // using typed APIs