【发布时间】:2017-07-05 15:10:55
【问题描述】:
使用邮政编码时,通常会删除前面带有“0”的州,即 csv 文件中带有“02111”的马萨诸塞州地址将被导入并截断为“2111”。
Q1:read.csv 保持邮政编码完整的正确列标题是什么?
Q2:导出数据帧并保持邮政编码完整的正确方法是什么?
来源DF:FDIC
library(readr)
library(dplyr)
library(tidyr)
FDIC_1_source <- read_csv("OFFICES2_ALL.CSV")
NEState<-c("CT", "DC", "DE", "MA", "MD", "ME", "NH", "NJ", "NY", "PA", "RI", "VA", "VT")
FDIC_2_filtered<-FDIC_1_source[FDIC_1_source$STALP %in% NEState,]
write.csv(FDIC_2_filtered,file="FDIC_2_filtered.CSV")
我在 SO 上发现的最接近的问题是 With Dates and Numbers 但是我想不出一种方法来使用邮政编码的文档。
【问题讨论】:
-
CSV 文件中是否确实缺少前导零,或者当您在 Excel 中打开 CSV 文件以记录特定的不良行为者时,它们是否会消失?跨度>
-
Excel 在导入时总是去掉“0”。尽管该列可以重新分类为“ZIP”,但不会保存好...保存为 csv。虽然在另存为 excel 文件时会保留重新分类。 CSV 非常适合在不同的软件平台上工作。因此,需要使用 R 将特定列自动分类为“ZIP”,并将“ZIP”导出为 CSV。
-
如果在读取 csv 后数据框中的零被丢弃,则尝试在读取 csv 时指定列类型 IE
read_csv("OFFICES2_ALL.CSV", col_types = "character") -
@MattJewett 这是一个修复方法,但前提是 CSV 具有前面的 0。描述它的最佳方式是,对于源文件,您将在 CSV 中包含邮政编码。我想导入到 R 并让 R 识别 ZIP 列并自动转换地址,即马萨诸塞州邮政编码“2111”->“02111”。