【发布时间】:2021-12-30 06:48:47
【问题描述】:
我在原始数据中隐藏了电话号码和个人姓名。我已经为我关于电话号码的工作询问并得到了here 的答案。
在屏蔽个人姓名的情况下,我有以下代码:
x = c("010-1234-5678",
"John 010-8888-8888",
"Phone: 010-1111-2222",
"Peter 018.1111.3333",
"Year(2007,2019,2020)",
"Alice 01077776666")
df = data.frame(
phoneNumber = x
)
delName = c("John", "Peter", "Alice")
for (name in delName) {
df$phoneNumber <- gsub(name, "anonymous", df$phoneNumber)
}
那个代码对我来说不是问题,
> df
phoneNumber
1 010-1234-5678
2 anonymous 010-8888-8888
3 Phone: 010-1111-2222
4 anonymous 018.1111.3333
5 Year(2007,2019,2020)
6 anonymous 01077776666
但我有超过 10,000 个个人姓名要掩盖。 R 现在正在处理第 789 个进程。时间可以解决,但我想知道减少处理时间的方法。我搜索了foreach,但我不知道如何调整我上面的原始代码。
【问题讨论】:
标签: r performance foreach parallel-processing gsub