0
我期待深入了解我的数据。我使用sklearn PCA将它们转换成VSM,并将它们绘制成matplotlib图形。这涉及绘制新文档以绘制散点图
使用管道
test = pipeline.fit_transform(docs).todense()
件到我的模型铸造的文件的数量矩阵
pca = PCA().fit(test)
然后我使用变换
将其转换data = pca.transform(test)
个
最后我用绘制Matplotlib
plt.scatter(data[:,0], data[:,1], c = categories)
我的问题,结果是这样的:我如何采取新的句子,并确定他们将在于相对于其他文件绘制。用X标记他们的相对位置?
感谢