【发布时间】:2015-03-18 04:52:53
【问题描述】:
有人告诉我,R 是一个很好的数据处理工具。所以我想弄清楚是否可以(容易)用 R 进行正则表达式数据提取。
以下是从 Python 中提取两个关键信息的示例:
import re
str = "oh, 100.0 dollar is 621.5 yuan"
m = re.search("([\d+\.\d+]+).*?([\d+\.\d+]+)",str)
if m:
print m.group(1),"->",m.group(2)
Python 的输出是:
100.0 -> 621.5
Python 的结果真的很酷,但是如何在 R 中有效地做到这一点?
【问题讨论】:
-
Python 也有许多用于数据处理的工具。您无需为此学习 R。
-
R 也支持正则表达式,你试过了吗? stat.ethz.ch/R-manual/R-devel/library/base/html/regex.html