【发布时间】:2017-04-11 01:56:39
【问题描述】:
我正在读取 data.csv 文件的列,并尝试使用正则表达式从列中的字符串中的最后一个正斜杠之前提取所需的文本。我的列数据如下所示:
class:
org/apache/flume/api/virtual/loeadBalancing.java
org/apache/flume/file/Channel/testing/test2.java
org/apache/flume/recoverable/memory/test1.java
org/apache/flume/source/scribe/LogEntry.java
org/apache/flume/source/jms/TestJMSMessageConsumer.java
我想要的输出是:
org/apache/flume/ap/virtual
org/apache/flume/file/Channel/testing
org/apache/flume/recoverable/memory
org/apache/flume/source/scribe
org/apache/flume/source/jms/TestJMSMessageConsumer
所以,基本上,我试图从类列中提取子字符串,不包括出现在它之后的文本和反冲。我当前的代码是:
dfkg<- gsub( "\\.[^/]*$", "", data$class)
有人可以更正我的常规字符串以生成所需的输出吗?
【问题讨论】:
-
你的声明
extract desired text before the last forward slash from strings,那为什么最后一个是rg/apache/flume/source/jms/TestJMSMessageConsumer -
dirname(data$class) -
抱歉打错了。现已更正。
-
我的意思是
org/apache/flume/source/jms/TestJMSMessageConsumer.java应该是org/apache/flume/source/jms