【发布时间】:2019-09-21 12:49:46
【问题描述】:
我正在尝试从以下网站上列出的文章中获取标题、日期和作者:https://coreyms.com/
这是我运行的代码
from bs4 import BeautifulSoup
import requests
import lxml
import csv
source = requests.get('http://coreyms.com').text
soup=BeautifulSoup(source,'lxml')
for match in soup.find_all('div',class_='site-
container'):
headline=match.main.header.h2.a.text
print(headline)
date=match.main.header.p.time.text
print(date)
author=match.main.header.p.span.a.span.text
print(author)
print()
但是,当我运行此代码时,我仅从第一项中获取信息。任何帮助将非常感激。谢谢!
【问题讨论】:
标签: web-scraping beautifulsoup lxml