【发布时间】:2016-08-20 13:27:18
【问题描述】:
我正在用 python 构建一个网络爬虫。它正在爬取一个新闻站点。但是当我收到此错误时:TabError:缩进中制表符和空格的不一致使用。它在我脚本的第 28 行。不知道怎么解决。
import requests
from lxml import html
import time
from colorama import *
def crawl():
URL = "http://www.svt.se/nyheter/"
host = "http://www.svt.se"
blankHTML = requests.get(URL)
tree = html.fromstring(blankHTML.text)
Nyheter = tree.xpath('//span[@class="nyh_teaser__heading-title"]/text()')
beskrivning = tree.xpath('//span[@class="nyh_teaser__text"]/text()')
link = tree.xpath('//a[@class="nyh_teaser__link"]/@href')
link_list = []
newsnumber = 0
numbersOfNews = 0
for numb in range(1,10):
print(Fore.GREEN + "Titel: " + Nyheter[newsnumber])
print(Fore.YELLOW + "Beskrivning: " + beskrivning[newsnumber])
print(link[newsnumber])
link_list.append(link)
newsnumber += 1
choice1 = input("<News> ").lower()
while True:
if choicel == 1:
URL = host + link_list[0]
blankHTMLS = requests.get(URL)
treek = html.fromstring(blankHTMLS.text)
wholeNew = treek.xpath('//div[@class="nyh_article__body]/p/text()')
print(wholeNew)
crawl()
【问题讨论】:
-
建议将所有制表符 ('\t') 转换为四个空格 (' ')。
-
我真的不明白你的意思是什么,你能试着用另一种方式解释吗?
-
您应该将编辑器设置为使用 4 个空格而不是制表符。他们中的大多数都有执行此操作的设置。你用的是哪一个?
-
我使用 sublime text
-
尝试查看this answer 中提到的空白和制表符。
标签: python-3.x web-crawler syntax-error