如果我想要一个随机火车/测试分裂,我用的是sklearn辅助函数:如何获得sklearn非洗牌train_test_split
In [1]: from sklearn.model_selection import train_test_split
...: train_test_split([1,2,3,4,5,6])
...:
Out[1]: [[1, 6, 4, 2], [5, 3]]
什么是最简洁的方式来获得一个非改组的列车/测试分裂,即
[[1,2,3,4], [5,6]]
编辑目前我使用
train, test = data[:int(len(data) * 0.75)], data[int(len(data) * 0.75):]
但希望有更好的东西。我已经打开了sklearn https://github.com/scikit-learn/scikit-learn/issues/8844
EDIT 2个问题:我的PR已经被合并,在scikit学习版本0.19,您可以shuffle=False
传递参数给train_test_split
获得非改组的分裂。
谢谢,这几乎看起来像我想要的但如果我不知道我想吐的价值?即说我只想做一个60/40分割? – maxymoo
嗯是的我希望能避免这样的事情,但也许是不可能在这种情况下,你认为它可能会更清楚,只要做'data [:int(len(data)* p)],data [int(len(数据)* p):]' – maxymoo
是的。这绝对有效。 – Psidom