得到错误使用Jupyter笔记本

sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item")

错误加载CSV文件到数据帧时：当我星火更新到2.2.0版本得到错误使用Jupyter笔记本

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

来源

2017-09-27 Shreya Singh

此错误与pyspark无关。您的文件缺少报价，撇号或其他内容。检查错误信息中给出的行号。 – ashwinids

这不会看起来像csv问题，即使创建一个虚拟的csv并使用它，我得到相同的错误。 –

你能分享可能产生上述错误的最小可能虚拟csv文件的内容吗？ – ashwinids

的问题得到了解决。

Python 3.6兼容Spark v2.2.0

来源

2017-09-30 05:51:27

得到错误使用Jupyter笔记本

回答

相关问题