【发布时间】:2021-11-19 03:50:23
【问题描述】:
在我的网络抓取练习中,我想出了一种特殊形式的字符串 -
st<-c("Samsung Galaxy M21 2021 Edition (Charcoal black , 6GB RAM, 128GB Storage) | FHD+ sAMOLED | 6 Months Free Screen Replacement for Prime")
我想要"|"之前的字符串部分,即我想要输出为:
"三星 Galaxy M21 2021 版(炭黑色,6GB RAM,128GB 存储)”
我正在尝试s <- st %>% str_replace("|.*","")
但没有比“st”(上面定义)得到任何改进
【问题讨论】:
-
试试这个而不是
|.*:\|.*$ -
网站是什么?可能有更好的方法来获取您想要的字符串。您如何获得上面显示的结果?
-
其实这是我在amazon上搜索“realme手机”时发现的手机名称之一。在。只有几个名字是这种形式的。更多详情您可以访问:amazon.in/s?k=Realme+Mobile+Phones&ref=nb_sb_noss_2
-
你可能会看到这篇文章的想法。 stackoverflow.com/questions/46661012/…
标签: r web-scraping substring str-replace