【发布时间】:2015-08-21 14:27:06
【问题描述】:
我正在尝试使用 Beautiful Soup 编写简单的脚本,它可以只删除两个信息并从网站生成一个 SQL 文件。
import mechanize
import urlparse
from bs4 import BeautifulSoup
op = mechanize.Browser()
op.open("https://www.mentalhelp.net/symptoms/")
for link in op.links():
print link.text
print urlparse.urljoin(link.base_url, link.url)
get = BeautifulSoup(urllib2.urlopen("https://www.mentalhelp.net/symptoms/").read()).findAll('p')
print get
print "\n"
错误:
C:\Python27>python symtoms.py 文件“symtoms.py”,第 8 行 打印链接.文本 ^ IndentationError: 需要一个缩进块
我只想要一个脚本,它会废弃这些项目和简短描述并生成一个只有两个字段“name”和“sug”的 SQL 文件。 “name”是那些项目,“sug”是那些描述。
【问题讨论】:
标签: python web-scraping beautifulsoup web-crawler mechanize