2010-12-12 55 views
1

我想计算标签分隔的文本文件中的13个变量之间的皮尔逊相关性,其中每列是变量。我正在使用java,并希望有人可以给我一些关于哪些库或我应该使用哪些函数的指导。我猜测我首先需要阅读文件的内容,但不知道如何让程序知道每个列都像是一个数组,这使我能够完成我所需的计算。我原以为java.io包是我开始使用的最佳位置,但却无法弄清楚我可以使用哪些类来解决问题。我也看过http://commons.apache.org/math/,它具有测量皮尔逊相关性的功能,但这太容易了,因为这是一个Uni任务,我必须从零开始实施它。通过查看appache皮尔逊相关性,他们似乎已经接近像矩阵那样的矩阵,矩阵的每一列都是一个变量。需要一些指向正确的方向关于计算皮尔逊的相关性在java

对不起,我的问题的漫长描述。如果你们知道任何网站或任何好的kewords搜索或任何其他信息,我将不胜感激。谢谢,Arlind。

回答

1

你应该可以使用标准的java数学,字符串,文件I/O库,以及一些数组和循环来做到这一点!

请先阅读本文,以了解如何阅读文件。 http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

循环内部使用String.split(String regex)方法解析您的csv文件。例如strLine.split( “”)。

转换这对双打的阵列,通过使用Double.parseDouble在串中的每个串[]

从那里可以使用 Math.sqrt(双a)和 Math.pow(双a,double b)函数以及一些简单的循环来计算每对变量的相关性。

希望这是足够的信息让你开始,如果你想获得更多帮助,请随时发回。

+0

嗨塞缪尔。这么晚才回复很抱歉。我有一段时间没有去过。非常感谢您的建议。现在我可以逐行读取一个文件,并将其分成不同的行。我似乎无法做到的是将这些行转换为单独的双打数组。我看过不同的书籍和网页,但找不到任何有用的东西。你可能知道任何在线资源,可以帮助我更好地理解。在此先感谢,Arlind。 – Jetnor 2011-01-13 02:17:18