2010-03-24 135 views
-1

如何将非结构化数据转换为结构化数据?例如电子邮件联系人,从非结构化文本到结构化格式。将非结构化数据转换为结构化数据?

有没有任何算法可以做到这一点?

+0

请提供一些更多细节..例如,样本输入和样本输出将有助于理解您的问题。 你想要通过电子邮件的例子来转换什么和为什么你的意思是让所有的ID去除域名或其他东西,或者你只是想要一个CSV的电子邮件ID。请提供更多详细信息... – mkamthan

+0

请编辑描述以解释您打算使用哪种编程语言,以及(如果是)使用该语言标记您的问题。 – bignose

+0

@mkamthan:基本上获取ID并存储在数据库的电子邮件字段中。 – Jony

回答

4

没有通用算法来“采取非结构化数据并将其转换为结构化数据”,no。它是高度依赖于什么样的输入的可能范围,以及所需的结构是什么,以及要应用所需要的转换等

类的问题被称为“解析”:你需要构建一个解析器以获得您期望的特定输入,并使用该解析器根据发现的输入生成结构。

您的编程语言可能会有可用的解析库来协助构建特定的解析器。

+0

你能告诉我们任何可以做到这一点的第三方分析器吗? – Jony