【问题标题】:Run a local SAS database运行本地 SAS 数据库
【发布时间】:2013-02-13 07:36:00
【问题描述】:

我对 SAS 编程非常陌生。但是,我有兴趣使用该数据开发算法的数据集。但是,我不会总是连接到 Internet,因此无法通过 Web 访问数据库。

相反,我想知道:

  1. 复制超大型 SAS 数据库 (3 TB) 的最佳方法是什么?

  2. 是否可以使用我的 PC(而不是专用硬件)运行本地 SAS 服务器并执行 SAS 脚本?

【问题讨论】:

  • 或者,如果 2 不可行,是否可以/推荐将 SAS 数据文件转换为不同的格式,如 mysql?

标签: database database-design sas


【解决方案1】:

您当然可以在本地运行 SAS,尽管桌面许可很昂贵(取决于您许可的产品,第一年可能需要 2000 美元)。您当然也可以将文件存储为 MYSQL 格式(或其他任何格式); MYSQL 可以轻松读取逗号分隔文件 (CSV),并且您可以非常快速地从 SAS 生成创建表脚本。

我要注意的是,您通常不会将 SAS 文件称为“数据库”,尽管这并没有什么不准确的地方;但是,它们比整个数据库更接近“表”(对于许多表来说,它们通常是一个独立的数据和元数据单元)。 SAS 文件通常称为“数据集”,SAS 数据集和元数据(格式目录等)的集合称为“库”。

复制一个 3TB 的 SAS 数据集,如果它是一个单一的数据集,可以通过正常的文件传输方法(FTP、HTTP、windows 或 UNIX 复制等)来完成。SAS 数据集通常可以很好地压缩(即 3TB 未压缩的 SAS 数据集可能很容易压缩到 2-3GB,具体取决于具体细节)。您可能需要获取 SAS 格式目录以及数据集(存储值标签);此外,这是特定于操作系统和位的(因此 Windows 32 位不能使用 Unix 甚至 Windows 64 位格式目录);有一些方法可以在适当的版本中获取格式目录(或者更常见的是,获取目录的数据集转储以在本地重新创建)。

【讨论】:

    【解决方案2】:

    是的,您可以为 PC 授权 SAS。

    您是否建议将 3tb 数据集下载到您的本地环境?哇。如果您是 SAS 新手并想开发算法,为什么不从一些较小的数据集开始,例如 SAS 本身附带的数据集或您自己创建的数据集?然后,一旦你确定了一个好的算法,也许就需要在 3tb 数据集上运行它。

    或者可能先获取完整数据集的一个子集。

    【讨论】:

      猜你喜欢
      • 2013-06-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-08-11
      • 1970-01-01
      • 1970-01-01
      • 2012-02-06
      • 1970-01-01
      相关资源
      最近更新 更多