【发布时间】:2021-05-05 06:47:30
【问题描述】:
我有几年的每日出院数据,以固定宽度的“.txt”格式提供如下:
年份:1962
Mean daily discharge in m3/s
============================
Day Jan. Feb. Mar. Apr. May Jun. Jul. Aug. Sep. Oct. Nov. Dec. Year
01 NA NA 169 205 458 472 975 2010 1310 755 307 214
02 NA NA 163 205 467 462 952 2590 1230 800 307 211
03 NA NA 160 198 410 415 946 2340 1220 687 303 211
04 NA NA 158 189 396 392 946 2200 1160 675 303 208
05 NA NA 195 180 365 467 1040 2090 1230 652 299 205
06 NA NA 231 192 335 508 1150 2030 1260 634 295 205
07 NA NA 202 195 311 566 1250 1970 1230 628 291 202
08 NA NA 198 192 291 640 1220 1860 1160 611 288 202
09 NA NA 195 195 284 813 1100 1800 1180 588 280 198
10 NA NA 192 192 273 981 1050 1690 1260 577 273 198
11 NA NA 192 195 269 1030 946 1570 1160 555 269 195
12 NA NA 189 189 265 1000 1100 1850 1110 539 265 192
13 NA NA 189 186 262 1050 1040 1830 1090 518 265 192
14 NA NA 186 198 269 1060 934 1790 1180 503 262 189
15 NA NA 192 205 280 1150 1300 1900 1120 492 258 186
16 NA NA 192 211 295 1170 1470 2080 1160 467 255 183
17 NA NA 192 205 315 877 1490 2140 1260 453 255 183
18 NA NA 192 208 311 807 3030 1990 1130 448 251 180
19 NA NA 192 214 284 774 1360 1940 1700 434 248 180
20 NA NA 189 238 277 915 1310 1880 1830 429 244 178
21 NA NA 189 238 303 1020 1240 1780 1640 415 241 175
22 NA NA 186 277 319 1200 1200 1420 1860 406 238 175
23 NA 160 183 269 323 1280 1120 1350 1940 392 234 172
24 NA 163 183 315 357 1360 1160 1340 1650 369 231 169
25 NA 178 186 361 365 1380 1260 1570 1420 357 227 169
26 NA 169 189 361 365 1340 1360 1730 1220 344 224 169
27 NA 169 189 410 365 1300 1810 1880 1130 335 221 166
28 NA 169 192 434 387 1250 2090 1640 1040 327 218 166
29 NA 195 419 419 1210 1800 1550 981 311 218 163
30 NA 202 387 415 1150 1800 1500 969 311 214 163
31 NA 205 438 1850 1690 307 163
Min NA NA 158 180 262 392 934 1340 969 307 214 163 NA
Mean NA NA 189 249 338 936 1330 1840 1290 494 259 186 NA
Max NA NA 231 434 467 1380 3030 2590 1940 800 307 214 NA
我的目标是将其转换为时间序列。我尝试使用 read.fwf() 读取文件和 pivot_longer() 函数来获取时间序列。但问题是我无法指定每个月的天数,因此有 372 天。由于我是 r 的新手,因此我对许多 r-packages 并不熟悉。这里有人可以提出一种更简单的方法来实现我的目标吗?谢谢!
【问题讨论】:
-
在
pivot_longer中使用values_drop = T -
@ANilGoyal Yah values_drop = T 有效,但是它忽略了我不想忽略的数据集中所有可用的 NA。
-
这不是问题。之后可以使用
tidyr::complete