【发布时间】:2019-09-27 18:15:38
【问题描述】:
我有一个如下所示的数据:
- www.r-computer.com
- www.rscompass.com
- www.italy.it 等等。
我编写了一个如下所示的脚本:
data['website']=data['Website address'].str.split('www.').str[1]
data['website']=data['website'].str.split('.com').str[0]
这基本上首先删除了“www”,然后第二个代码旨在从字符串中删除“.com”。 我应该得到的第一个和第二个数据点的结果应该是:
- r 计算机
- rscompass
但我得到的是“r”。所以我认为Python没有解释“。”作为点,但“com”之前的任何字符。
我想知道如何删除“.ru”、“.com”、“.it”等短语。请帮助。
【问题讨论】:
-
字符串访问器
str.split()使用正则表达式(我认为),所以你想用'\.com'或'www\.'来逃避野猫。
标签: python-3.x string pandas dataframe split