【发布时间】:2026-02-18 02:30:01
【问题描述】:
简介
自从我开始熟悉scrapy,我尝试从随机网页中抓取一些链接。
问题
我保存到我的 items.py 文件的链接没有写:“https://”,但我需要它们作为超链接。
所以我想在实际链接之前添加“https://”,以便将其格式化为超链接。
我的代码
def parse_target_page(self, response):
card = response.xpath('//div[@class="text-center artikelbox"]')
for a in card:
items = LinkcollectItem()
link = ('a/@href')
items ['Title'] = a.xpath('.//h5[@class="title"]/a/text()').get()
items ['Link'] = a.xpath('.//h5[@class="title"]/a/@href').get()
yield items
我尝试在索引 0 处插入字符串,但没有成功
我的输出应该将所有链接打印为 csv 文件中的超链接。
【问题讨论】:
标签: python-3.x list xpath web-scraping scrapy