我使用Scikit-Learn培训了一个分类器。我正在加载输入以从CSV中训练我的分类器。我的一些专栏(例如'Town')的价值是规范的(例如可以是'纽约','巴黎','斯德哥尔摩',...)。为了使用这些规范列,我正在使用Scikit-Learn的LabelBinarizer进行单热编码。 我这是怎么训练之前转换数据: import pandas as pd
from sklearn.prep
其实,我的问题是基于: Is there a faster way to update dataframe column values based on conditions? 因此,数据应该是: import pandas as pd
import io
t="""
AV4MdG6Ihowv-SKBN_nB DTP,FOOD
AV4Mc2vNhowv-SKBN_Rn Cash 1,FOO