【发布时间】:2014-11-14 22:48:16
【问题描述】:
我认为这是有经验的程序员一直在做的事情。但是,鉴于我有限的编程经验,请多多包涵。
我有一个 excel 文件,其中包含特定的单元格条目
[[{"from": "4", "response": true, "value": 20}, {"from": "8", "response": true, "value": 20}, { “来自”:“9”,“响应”:真,“值”:20},{“来自”:“3”,“响应”:真,“值”:20}],[{“来自”: “14”,“响应”:假,“值”:20},{“来自”:“15”,“响应”:真,“值”:20},{“来自”:“17”,“响应” ": false, "value": 20}, {"from": "13", "response": true, "value": 20}]]
现在,对于每个这样的条目,我想获取每个大括号中的信息并从中生成一行数据。每个这样的行将有 3 列。例如,由大括号内的第一个条目形成的行应分别具有条目“4”、“true”和“20”。我发布的部分应该给我 6 个这样的行,对于 n 个这样的重复,我应该得到一个 6n 行和 4 列的矩阵(一个标识符,加上提到的 3 列)。
最有效的方法是什么?通过“这样做”,我的意思是学习技巧,然后实施它。我可以在我的实验室中使用很多软件包(Excel、Stata、Matlab、R),所以这应该不是问题。
【问题讨论】:
-
欢迎来到 SO!请在您的问题中包含您已经尝试过的事情的示例以及您为尝试解决问题所做的研究,这将有助于我们为您制定一个好的答案:)
-
第四列的标识符从何而来?我在你的数据中没有看到。由于该文件已经在 Excel 中,而且单元格内容似乎格式正确,我将只使用正则表达式来解析数据;用户定义的对象和集合将其收集在一起,然后将输出放在新工作表上。
标签: r excel text-parsing string-parsing