【发布时间】:2018-08-08 21:25:28
【问题描述】:
这是正文:
data$charge[1]
[1] "Count #1 as Filed: In Violation of; 21 O.S. 645; Count #2 as Filed: In Violation of; 21 O.S. 1541.1;Docket 1"
我目前正在尝试从法律数据中提取法规。我的代码如下所示:
str_extract_all(data$charge[1:3], "(?<=Violation of;)(\\D|\\d){4,20}(?=;Count |;Docket)")
[[1]]
[1] "21 O.S. 645" "21 O.S. 1541.1"
[[2]]
[1] "21 O.S. 1435 "21 O.S. 1760(A)(1)
[[3]]
[1] "21 O.S. 1592"
我想将它们作为列添加到这样的数据框中:
id name statute1 statute2 statute3
1 BLACK, JOHN 21 O.S. 645 21 O.S. 1541.1 NA
2 DOE, JANE 21 O.S. 1435 21 O.S. 1760(A)(1) NA
3 ROSS, BOB 21 O.S. 1592 NA NA
谢谢!这有意义吗?
【问题讨论】:
-
我认为我们可以使用可重现的示例。
-
你的意思是我从中提取的文本吗?
-
是的,如果我们不能重新创建它,我们就无法解决您的问题。阅读How to make a great R reproducible example