2011-05-16 91 views
4

我打算在Linux上使用apache poi或python xlrd来读取Linux上的程序中的电子表格。我偏向于python xlrd,但是apache poi对我来说似乎是一个更完整的项目(可能是因为它受到apache基金会的支持)。什么会是更好的选择(我偏向于python,但仍然......)?我希望能够阅读大多数的Excel版本和读取宏。apache poi vs python xlrd

回答

2

根据您的需求的复杂性,您可能只需使用CLI即可。 Tika处理与POI(和其他图书馆)的交谈,并会为您提供该文档的XHTML或纯文本版本。如果你只是想要一个简单的linux命令,那可能就足够了。

否则,它可能取决于你的Java技能是什么样子。 POI应该做你需要的一切,但是你需要编写一些代码来抓取你感兴趣的部分。看看quick guide让你开始。

(我不知道xlrd,抱歉)

+0

我基本上想要在网络服务器上运行它。如果它的Java,我认为我将不得不写jsps让人们击中它。然而,我确实需要更多的功能 - 比如提取公式等,而不仅仅是纯文本。我猜,Apache POI会很好吗? – 2011-05-16 18:46:44

+0

与Tika一起玩,因为您可能会发现它确实提供了您需要的WRT公式等,而Tika与SOLR的集成可能有助于在网络上发挥作用。否则,有很多漂亮的Java Web框架可以让您从POI中提取数据,而无需触摸JSP! – Gagravarr 2011-05-16 21:43:23

0

一个选择可能给两全其美将利用通过Jython的Apache的POI(与Java互操作Python语法)。

Here是一个日期jython的例子...我相信这将需要改变与新版本的POI。