【发布时间】:2016-06-22 07:37:31
【问题描述】:
我尝试循环查找url_data。 url_data 是一个字符串数组。我得到一个IndexError,上面写着:
keywords[i]=urlparse.urlparse(url_data[i])
IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boolean arrays are valid indices
我的代码:
import os
import csv
import numpy as np
import pandas
import urlparse
from numpy import genfromtxt
os.chdir("C:\Users\EDAWES01\Desktop\Cookie profiling")
data = pandas.read_csv('activity_url.csv', delimiter=';')
data_read=np.array(data)
quantity = data_read[:, 2]
url_data = data_read[quantity==1][:,1]
url_data #extract URL data
keywords=[]
for i in url_data:
keywords[i]=urlparse.urlparse(url_data[i])
keywords[i]=keywords[2] #this is the path element
keywords[i]=keywords[i].split("/")
keywords
【问题讨论】:
-
keywords被初始化为一个空列表。所以没有有效的索引。循环尝试多次使用i作为索引,但是(1)i显然不是整数,并且(2)即使是,它也会超出范围,因为它们是 全部超出了空列表的范围。 -
keywords是一个错误。但错误信息是关于url_data[i]。url_data和i是str。str[str]不起作用