2014-10-17 51 views
1

我正在寻找更多关于使用特定搜索词或短语(可预测给我)转换为csv来处理文本行的方法的建议。例如:javascript中csv文件的轻度语言处理

一家位于中国南部的贸易公司以15%的价格提供了一批低挥发性炼焦煤,11月份的价格为$ 167/t。 香港一家贸易公司收到24%的中量焦煤报价,11月初交付价格为145美元/吨。

会成为像分隔的信息: 中国南方贸易商,卖家,低挥发性,15%,十一月,laycan,$ 167 香港交易员,采购员,中挥发,24%,十一月初,送货,$ 145

现在有javascript的答案开始我建议str.split(“\ n”)来设置数组。但在此之后......您会推荐在一行中寻找单词/短语匹配,然后设置蒸馏信息的相应逗号分隔线(以进入电子表格)。

我是一位希望加快数据输入速度的编辑,所以这就是为什么我有一个更一般的方法问题。如果我知道如何到达那里,所有搜索参数都可以与之抗争。在工作中,我们已经使用JavaScript来提取文件。人们说python很容易,但我希望在工作中更容易在Windows中使用。我一直在谷歌搜索我的方式没有成功的方法...只是一个框架,我可以到达那里。

回答

0

当你在谈论短语时,这意味着,你必须分析文本。

处理包括中文在内的多种语言的一个API,我可以推荐:http://nlp.linguasys.com