0
sc = pyspark.SparkContext()
sqlCxt = SQLContext(sc)
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item")
错误加载CSV文件到数据帧时:当我星火更新到2.2.0版本得到错误使用Jupyter笔记本
ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))
此错误与pyspark无关。您的文件缺少报价,撇号或其他内容。检查错误信息中给出的行号。 – ashwinids
这不会看起来像csv问题,即使创建一个虚拟的csv并使用它,我得到相同的错误。 –
你能分享可能产生上述错误的最小可能虚拟csv文件的内容吗? – ashwinids