2017-02-02 30 views
0

我目前正在研究具有3维连续变量(x,y,z)的机器学习分类问题,我也想添加已经是离散变量的时间(t)。我的数据看起来像这样一个例子:连续3维变量的离散化

 x     y     z     t 
[0.1 ,2.6, 0.0] [0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0]   1486033702474 

将采取每个连续变量的意思足够? 请问我该如何表示/格式化这些变量以在Python中的任何ML库中形成我的训练数据集?

+0

你能说清楚数据类型吗?第一个向量x是时间还是每个元素对应于x,y,z?展开你的数据... – mik

+0

@mik所有元素(x,y,z)将根据时间范围生成相同大小的向量say t2 - t1 – binkabir

回答

1

计算中的变量总是离散的。术语“连续”根本不适用,因为计算机是数字机器,因此只能以有限的速率采样数据。如果你想减少你的数据的粒度,取决于你的情况,取平均值是一个有效的选择。在Python中采取数据列表的意思:

mean_x = sum(x) * 1./len(x) 
+0

感谢Woody1193,我会试试看看是否有意义的东西来出。 – binkabir

+0

如果它不能按预期工作,请回头考虑变量表示的内容。试着弄清楚如何找出它们意义的核心。它是模糊的,但是在这个领域中按摩数学是需要一定的弯曲的 – Woody1193