2017-04-15 53 views
-1

我在星火(pySpark)加入两个数据集和输出看起来喜欢这个的Python:从提取变量加入

(u'SomeThing', (u'ABC', u'500')) 

我想做到以下几点:定义提取并只返回ABC功能(500)我写了这样的

 def extract_lasttwo_cols(three_cols): 
     a,b,c = three_cols.split(',') 
     return b,c 

功能,但在一个错误“的元组对象有没有属性分裂()” 是否可以提取变量不保存结果为文本文件,然后这个函数结果处理它们?

+2

你有* *元组,而不是一个字符串* *工作。你的问题是什么?如何访问元组中的元素?你有没有试过[docs](https://docs.python.org/3/tutorial/datastructures.html#tuples-and-sequences)? –

回答

1

元组是不可变的元组。 split()用于str类型。

这将返回B和单独C:

def extract_lasttwo_cols(three_cols): 
    b, c = three_cols[1][0], three_cols[1][1] 
    return b, c 
1

你的值是具有两个元件,由此,第二个元素是一个元组由本身

def extract_lasttwo_cols(three_cols): 
    return three_cols[1]