2013-02-13 43 views
0

我对SAS编程非常陌生。但是,我有兴趣使用这些数据来开发算法。但是,我并不总是连接到互联网,所以通过网络访问数据库不会是一种选择。运行本地SAS数据库

相反,我想知道:

  1. 什么是复制一个非常大的SAS数据库(3 TB)的最好方法?

  2. 是否可以使用我的PC(而不是专用硬件)来运行本地SAS服务器并执行SAS脚本?

+0

或者,如果2不可行,是否有可能/建议将SAS数据文件转换为不同的格式,如mysql? – Rishi 2013-02-13 07:41:58

回答

3

您当然可以在本地运行SAS,但桌面许可证很贵(取决于您许可的产品,第一年可能是2000美元)。你当然也可以将文件存储为MYSQL格式(或其他任何东西); MYSQL可以轻松读取逗号分隔文件(CSV),并且可以很快从SAS生成创建表格脚本。

我会注意到,你通常不会将SAS文件引用为'数据库',尽管它没有任何完全不准确的地方;然而,它们比整个数据库(通常是用于许多表格的数据和元数据的一个自包含单元)更接近“表格”。 SAS文件通常称为“数据集”,SAS数据集和元数据(格式目录等)的集合称为“库”。

复制3TB SAS数据集(如果它是单个数据集)可以通过正常的文件传输方法(FTP,HTTP,Windows或UNIX副本等)完成。SAS数据集通常压缩得非常好(即,3TB未压缩的SAS数据集可能很容易压缩到2-3GB,具体取决于具体细节)。您可能需要与数据集(存储值标签)一起获取SAS格式目录;此外,这是操作系统和位特定的(因此Windows 32位不能使用Unix甚至Windows 64位格式目录);有一些方法可以获取相应版本的格式目录(或者更常见的是,获取要在本地重新创建的目录的数据集转储)。

2

是的,您可以为PC授权SAS。

您是否打算将3tb数据集下载到您的本地环境?哇。如果您刚接触SAS并希望开发算法,那么为什么不从一些较小的数据集开始,例如那些随SAS提供的或您自己创建的数据集?然后,一旦你已经确定了一个好的算法,那么对于3tb数据集运行它的挑战可能是有保证的。

或者可能首先获得完整数据集的子集。