Apache-Spark：什么是map（_._ 2）的简写？

我读了项目的源代码，发现：Apache-Spark：什么是map（_._ 2）的简写？

val sampleMBR = inputMBR.map(_._2).sample

inputMBR是一个元组。

功能map的定义是：

map[U classTag](f:T=>U):RDD[U]

似乎map(_._2)是map(x => (x._2))的简写。

任何人都可以告诉我这些简写的规则吗？

来源

2015-03-25 chenzhongpu

_语法可能有点混乱。当_被单独使用时，它代表了匿名函数中的一个参数。所以，如果我们在配对上工作： map(_._2 + _._2)将是map(x, y => x._2 + y._2)的简写。当_用作函数名称（或数值名称）的一部分时，它没有特殊含义。在这种情况下，x._2返回元组的第二个元素（假设x是一个元组）。

来源

2015-03-25 02:38:28 Holden

collection.map（_._ 2）发射的元组的第二组件。来自纯斯卡拉的例子（Spark RDDs以同样的方式工作）：

scala> val zipped = (1 to 10).zip('a' to 'j') 
zipped: scala.collection.immutable.IndexedSeq[(Int, Char)] = Vector((1,a), (2,b), (3,c), (4,d), (5,e), (6,f), (7,g), (8,h), (9,i), (10,j)) 

scala> val justLetters = zipped.map(_._2) 
justLetters: scala.collection.immutable.IndexedSeq[Char] = Vector(a, b, c, d, e, f, g, h, i, j)

来源

2015-03-25 02:59:19 marekinfo

这是明确的！ – Jordon 2017-02-04 18:17:20

我找到了解决方案。

首先underscore这里是占位符。