【发布时间】:2018-09-05 19:18:01
【问题描述】:
我想用scrapy写一个爬虫,爬虫文件、item文件、piplines文件等都写好后,想把数据存入数据库,但是发现item['url的数据类型']其实是字符串类型,字符串包含列表,里面的数据我取不到,也没找到问题出在哪里。
import pymysql
from . import settings
class JumiaspiderPipeline(object):
def __init__(self):
self.conn=pymysql.connect(
host=settings.MYSQL_HOST,
db=settings.MYSQL_DBNAME,
user=settings.MYSQL_USER,
passwd=settings.MYSQL_PASSWORD,
charset='utf8',
use_unicode=False
)
self.cursor=self.conn.cursor()
def process_item(self, item, spider):
self.insertdata(item)
return item
def insertdata(self,item):
sql="insert into jumia_scrapy (url) values (" +item['url']+")"
print(sql)
print(type(item['url'])
self.cursor.execute(sql)
self.conn.commit()
为什么item['url'] 的类型是str?我无法获取列表数据。
【问题讨论】:
-
为什么不应该是
str类型?