【问题标题】:How to read .wpd sas dataset in python/pyspark如何在 python/pyspark 中读取 .wpd sas 数据集
【发布时间】:2021-03-08 11:19:12
【问题描述】:

嘿,我正在尝试在 python 中导入 .wpd sas 数据集。 但无法得到解决方案。 谁能帮我解决这个问题。

我已经在 python 中使用以下类进行了尝试: 导入json 将 numpy 导入为 np JSON数据类: def init(自我,文件名): 使用 open(filename) 作为 data_file:self.data = json.load(data_file)

def getDatasetCount(self):
    return len(self.data['wpd']['dataSeries'])

def getDatasetByIndex(self, index):
    return self.data['wpd']['dataSeries'][index]

def getDatasetByName(self, name):
    return [x for x in self.data['wpd']['dataSeries'] if x['name'] == name][0]

def getDatasetNames(self):
    return [x['name'] for x in self.data['wpd']['dataSeries']]

def getDatasetValues(self, dataset):
    values = []
    for val in dataset['data']:values.append(val['value'])
    return np.array(values)

但没有运气。 提前致谢.....

【问题讨论】:

  • 您可以尝试这种方法,但 WPD 是来自 SAS 模仿者的专有数据集,因此不知道文件结构是否相同。 anegron.site/2018/11/27/read-sas-datasets-in-python
  • 谢谢,但它不起作用
  • 您认为显示您实际尝试过的内容以及是否收到错误会有所帮助吗?不工作可能意味着你的电脑上的任何东西都爆炸了,你错过了一个时期或空间。
  • 仅供参考 - 我将标签更改为 WPS,因为这实际上与 SAS 无关。

标签: python pyspark sas-wps


【解决方案1】:

WPS 允许您保存 sas7bdat 文件。我建议使用 WPS 创建新文件,而不是尝试读取 WPS 文件。

然后pandas,一个python扩展,可以将sas sas7bdat文件读取为dataframe

https://pandas.pydata.org/docs/reference/api/pandas.read_sas.html

【讨论】:

    猜你喜欢
    • 2017-01-01
    • 2013-01-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-01-04
    相关资源
    最近更新 更多