【发布时间】:2015-09-15 01:43:10
【问题描述】:
我正在尝试制作一个 python 脚本来读取 crunchyroll 的页面并为我提供字幕的 ssid。
去源码找ssid,我要提取这个元素ssid后面的数字
<a href="/i-cant-understand-what-my-husband-is-saying/episode-1-wriggling-memories-678035?ssid=154757" title="English (US)">English (US)</a>
我想提取“154757”,但我的脚本似乎无法运行
这是我当前的脚本:
import feedparser
import re
import urllib2
from urllib2 import urlopen
from bs4 import BeautifulSoup
feed = feedparser.parse('http://www.crunchyroll.com/rss/anime')
url1 = feed['entries'][0]['link']
soup = BeautifulSoup(urlopen(url1), 'html.parser')
如何修改我的代码以搜索和提取该特定数字?
【问题讨论】:
-
您在此处提出了多个问题,但未接受任何答案。如果您先接受之前问题的答案,其他用户会更愿意提供帮助。
-
@serk .. 完成...我找不到如何接受它们...相反,我赞成他们:|
-
欢迎来到stackoverflow!我建议您使用tour。
标签: python string python-2.7 beautifulsoup text-extraction