2017-09-27 96 views
0
sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item") 

错误加载CSV文件到数据帧时:当我星火更新到2.2.0版本得到错误使用Jupyter笔记本

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

+0

此错误与pyspark无关。您的文件缺少报价,撇号或其他内容。检查错误信息中给出的行号。 – ashwinids

+0

这不会看起来像csv问题,即使创建一个虚拟的csv并使用它,我得到相同的错误。 –

+0

你能分享可能产生上述错误的最小可能虚拟csv文件的内容吗? – ashwinids

回答

0

的问题得到了解决。

Python 3.6兼容Spark v2.2.0