-3

我知道使用神经网络处理文本相关的任何事情都很困难,因为它们存在非数值输入数据的问题。 但我不确定数学集。和套集。与[0,1,2]和[3,4,5]或[[0,1],[2,3]]和[[4,5],[6,7]]一样,人工神经网络可以使用数学集吗?

应该可以通过计算所有相应元素之间的距离来计算它们之间的距离,对吗?我无法真正找到任何信息,也不想在不确定的情况下开始使用神经网络。

(用谷歌搜索“设定”恰恰是没有前途的,因为你得到的结果是术语“数据集”什么......)

编辑:

第一:分配特别要求一神经网络,所以我不能使用k-means或任何其他聚类方法。

所以原来的问题并没有真正解决实际问题。我不必考虑距离度量标准,而是将这些集合添加到激活函数以及如何将它们映射到单个值的方法。但是,关于距离度量,我实际上并不确定我需要神经网络的哪个点。我想这是一个基本的理解问题。

我现在只想写下一些想法。

让我困惑的是标准化的类别。有三个类别'红色','绿色'和'蓝色',你可以将它们映射到数字1到3,但这意味着'红色'和'绿色'之间的距离要比'绿色'更大,而不是案件。因此,类别被编码为(1,0,0)和(0,1,0)和(0,0,1),这给它们所有相同的距离。

所以它必须有可能以某种方式将这些添加到激活功能。我可以想象它们被解释为二进制数,所以(1,0,0)= 100 = 4,(0,1,0)= 010 = 2和(0,0,1)= 001 = 1。这将是一个独特的映射。但是数字1到3不同于上面提到的距离度量必须在某个点上。

所以问题仍然是如何将一个集映射到单个值。在将它添加到函数之前,我可以做到这一点,所以我不必选择一个也能保持集之间逻辑距离的映射,因为在应用距离度量时,我仍然可以将它应用于原始集合并且不必使用映射的值。那是对的吗?还是我仍然想念一些东西?

+0

正在计算设置*目标*之间的距离吗?因为有很多方法可以做到这一点,这取决于你如何定义它,但是一旦你定义了距离度量,就不需要机器学习;你可以直接计算它。如果这不是目标,那是什么?几乎可以肯定有一种方法可以对数据进行编码(并且与您所听到的相反,对文本数据进行编码也非常简单),但这取决于问题描述。 – Ray

+0

好吧,集群是目标..我想我的问题实际上是激活功能。我以某种方式需要将这些集合映射到可以添加到计算中的简单值,对吗?还是有一个激活函数可以处理集作为输入矢量的一部分? 或者我应该改变输入矢量的格式吗? 因此(4,5.2,[1,0])变成(4,5.2,1,0)?这似乎不是正确的给予更重要的那样.. 我很抱歉这些基本的问题,但我完全是新来的,无法找到一个令人满意的答案。 – Jessus

+0

如果你想使用神经网络,你需要找到一些方法将你的输入映射到矢量上。这种做法是否理想取决于区分{{1,0}}和{1,0}的重要性。我认为如果您编辑问题以提供关于这些集合的具体含义的更多细节以及为什么将它们集中起来,这将有所帮助。也许一些你想聚集在一起的例子。例如,“{0,1,2}”更类似于“{0,1}”还是“{{0},{1},{2}}”?一旦我们有了这样的信息,我们可以给出如何(继续...) – Ray

回答

0

神经网络,一般来说,没有这样的问题。图像识别和语言翻译都在其领域内。你需要什么需要的指标和操作,以有序的方式将您的投入与实际情况联系起来 - 您的距离度量标准将会做得非常好。

继续前进,建立你的神经网络。提供适当的距离功能,并让它训练。在完全松动之前,确保放置一些跟踪工具(例如打印语句)以跟踪操作几次迭代。