【发布时间】:2018-02-23 16:01:22
【问题描述】:
我尝试从我的 base_url 页面中抓取特定的行(图中标记为蓝色圆圈)。页面源代码在另一张图片中。
我的目标是获取那些
我的代码:
from bs4 import BeautifulSoup
from selenium import webdriver
import requests, csv, re, pandas, numpy
base_url = "http://www.basket.fi/sarjat/ottelu/?game_id=3502579&season_id=93783&league_id=4+"+"#mbt:2-400$t&0=1"
browser = webdriver.PhantomJS()
browser.get(base_url)
table = BeautifulSoup(browser.page_source, 'lxml')
for data in table.find_all("tr",{"class":"row2"}):
print(data.find("td").text)
【问题讨论】:
-
这是什么问题,请解释一下?
-
@TarunLalwani 我的代码没有得到我想要的 标签。
-
是否可以在 pastebin 或原始 url 中获取 HTML?
标签: python html selenium beautifulsoup