2011-04-06 69 views
1

我正在开发一个分布式系统,其中计划使用神经网络进行销售预测。设计用于销售预测的神经网络

该系统的一个小的描述:该系统结合了诸如药房,病人(电子健康记录)和医生模块等模块的工作流程。

问题是:我有很多关于医药销售的信息,我在设计神经网络时有点困惑。

我目前的设计: 输入(根据可以从数据库中取得的数据):

  1. 日期:的中药销售给客户(YYYY/MM/DD格式)的日期。
  2. 患者年龄分类:与患者的年龄分类相对应的值例如:(1 - > 12:小孩,13 - > 30:年轻......)
  3. 患者性别。
  4. Medicine ID:与药物相对应的值。
  5. 疾病ID:与产生处方的医生发现的疾病相对应的值。
  6. 医药单位成本:与购买药品成本相对应的价值。
  7. 医药单位出售量:与销售药品成本相对应的价值。
  8. 药房地址ID:与药房地址对应的值。
  9. 季节ID:与销售药物季节(夏季,冬季等)相对应的值。

输出:

  1. 数量:对应于将要出售的药物的量的值。
  2. 利润:与销售上一个数量的利润额相对应的值。

问题是:我不确定这个设计是否有意义,有什么更好的建议?

和我应该使用什么类型的网络来实现这个设计..我打算使用多层循环网络......这是一个不错的选择或有更好的模型?

注:我打算使用c#与“AForge.NET框架”实现网络。

希望这个描述是清晰和简单的,并为我的可怜的语言感到遗憾。

回答

1

我怀疑日期(绝对值)是否会给模型增加任何值。如果你有很多年的数据,它可能会产生一些意义,但是可以采取一些措施,例如,哪一天是四分之一,是周末还是一个工作日,或者是否在重大节假日等的n天内要强大得多。

我不知道你的直接领域,所以我对网络拓扑没有任何意见。如果你查阅一些论文,可能会有一些评论文章与你的研究领域有关,讨论趋势是什么。

+0

谢谢...日期的好主意...再次感谢 – mhdbny 2011-04-06 19:21:59

1

这似乎缺少一些信息。

为了预测未来,您需要一个基线。例如,在给定的处方中,有人可能会补充它的可能性有多大?这种可能性是否与任何其他指标(年龄组,性别,销售日期)有关?

同样季节只对患者的位置有影响,可能只对某些类型的药物(我在想冷/过敏/流感)。此外,为了提供任何真正的季节性准确性,您必须为该季节引入数据,例如过敏原水平等。

接下来,药物和利润预期成本仅与实际药物和没有必要预测销售可能性。

3

ID和类别对实际投入的选择很差,因为它们不是连续的,而且它们的相对量级意义不大。哪些ID最适合为不同的类别创建单独的网络,但是,鉴于您在此处定义了大量ID和类别,这意味着您拥有大量单独的网络,需要大量训练数据,因为它会被大量稀释。二元分类(如性别)可能有效,但是具有多个分类的任何分类都不会产生良好的结果。

对神经网络要非常小心,因为如果网络足够大,可以创建一些似乎给出预测的东西,但在训练集之外这确实没有意义。确保你有一个不参与培训的大型验证集。

+0

关于ID ...在我的预测中..我想预测将要出售的药物的数量...可以在其他表示? ...谢谢 – mhdbny 2011-04-06 19:27:34

+0

@mhdbny,我不确定我是否理解你的问题。神经网络一旦被训练,基本上只是一个复杂的数学函数,所以你想要喂它的数量是有数量意义的数量。类别(如药物的“id”)没有内在的数字含义,因此没有理由相信您可以使用您的网络创建的任何关联都具有预测效力。您经常可以通过足够的训练和足够大的网络“强制”一个关联,但是您真正创建的是训练数据的任意映射。 – 2011-04-06 20:40:25