我对Python和机器学习相对较新,但我一直在努力构建抵押价格的预测模型。我在挣扎的地方是使用K-最近邻算法来创建一个特征。使用K最近邻居创建特征
这就是我所理解的机制就是我要完成的任务:
- 我有两个数据文件:出售抵押贷款和上市
- 在这两个数据文件我也有同样的功能抵押贷款(包括纬度/长)。
- 我想创建一个列在抵押贷款上市列表,表示最紧密相关的家庭在中区价格的中间地区。
- 我将使用3中列出的方法创建1-3个月,4-6个月,7-12个月的列。
- 另一列将是这三列的趋势。
我在KNN归集上找到了一些东西,但这似乎并不是我要找的东西。
我该如何去执行这个想法?有没有我可能错过的资源会有所帮助?
任何指导,将不胜感激。谢谢!
“邻近地区最密切相关的住宅”:您是否只将距离视为您的关系测量? –
Hey Yuval。不,我认为它必须比这更广泛。彼此相距1英尺和4英尺的地方可能会有非常不同的价格。我的目标是考虑多种功能,包括距离,找到最喜欢的。 – Shad