【发布时间】:2020-06-04 00:56:14
【问题描述】:
我正在使用芝加哥犯罪数据集和 R 进行课程项目。数据集中的属性之一是 Block,其中包含事件发生的部分地址。例如:
+--------------------------+
| Block |
+--------------------------+
| 45xx N Locust Grove St |
| 65xx Hawthorne Ave |
+--------------------------+
Block 中的值长度不同,但我想创建一个街道类型为 St、Ave、Blvd 等的新变量。我尝试使用 tidyr 中的单独函数。
df <- df %>%
separate(Block, into = c("partial.address, "type"),
sep = " ", extra = "merge", fill = "left")
但是,这将返回数字 45xx,作为 partial.address 值,其余值在 type 中。如何从地址中选择街道类型?
我希望得到这样的输出:
+--------------------------+-------------+
| partial.address | type |
+--------------------------+-------------+
| 45xx N Locust Grove | St |
| 65xx Hawthorne | Ave |
+--------------------------+-------------+
【问题讨论】: