【发布时间】:2016-05-11 05:48:22
【问题描述】:
我有以下带有 9796 行的制表符分隔的 .txt 文件:
https://www.dropbox.com/s/fnrbmaw8odm2rqs/Kommunale_N%C3%B8gletal.txt?dl=0
我想将文件读入 R,但该文件不是经典表格格式。相反,每个感兴趣的变量有 279 行和 16 列,其中第一行定义变量名称,前 2 列定义城市名称和代码,接下来的 14 列定义 1993-2006 年。每个变量由一个空白行分隔。该文件包含 35 个变量。
我想将数据读入data.frame,但其中一列用于城市名称、城市代码和年份,而一列用于 35 个变量中的每一个。
如果您不习惯点击链接或喜欢较小的样本,以下说明了数据集(2 个变量和 3 年的观察):
Indbyggertal 1 januar
Københavns Kommune 101 466129 467253 471300
Frederiksberg Kommune 147 87173 87466 88002
Ballerup Kommune 151 45427 45293 45356
Andel 0-17-årige
Københavns Kommune 101 14.0 14.1 14.4
Frederiksberg Kommune 147 12.4 12.5 12.6
Ballerup Kommune 151 21.2 21.1 21.3
preferred out 的前 3 行应如下所示:
Municipality name Municipality code Year Indbyggertal 1 januar Andel 0-17-årige … Ældreudg (netto) pr 65+/67+-årig
Københavns Kommune 101 1993 466129 14 35350
Frederiksberg Kommune 147 1993 87173 12.4 33701
Ballerup Kommune 151 1993 45427 21.2 31126
【问题讨论】:
-
你能展示你尝试过的东西吗?你的输出应该是什么样子?
-
我刚刚尝试使用具有不同设置的
read.table,但我认为我需要使用某种apply或for循环。我将尝试说明首选输出。 -
你应该包含你的数据样本
-
@stasg 我已在链接中包含我的所有数据。是这个意思吗?
-
@stasg:好的,我会尝试提供一个说明性示例。
标签: r dataframe read.table