【发布时间】:2018-12-12 07:01:01
【问题描述】:
我编写了一个脚本来从网站上抓取数据。它有 2 列。但我想在其中添加另一列(抽象列)。我怎样才能在同一个循环中做到这一点?我需要在第三列中获取“抽象”数据。图片附在下面。
代码如下:
import requests
import csv
from bs4 import BeautifulSoup
file = "Details181.csv"
Headers = ["Category", "Vulnerabilities", "Abstract"]
url = "https:/en/weakness?po={}"
with open(file, 'w', newline='') as f:
csvriter = csv.writer(f, delimiter=',', quotechar='"')
csvriter.writerow(Headers)
for page in range(1, 131):
r = requests.get(url.format(page))
soup = BeautifulSoup(r.text, 'lxml')
for title in soup.select('div.title > h1'):
csvriter.writerow([title.strip() for title in
title.text.split(':')]);
【问题讨论】:
标签: python-3.x web-scraping beautifulsoup