【发布时间】:2017-07-17 11:57:46
【问题描述】:
您好,我一直在努力解决这个问题,我正在尝试遍历行并从中选择数据,然后将它们分配给变量。这是我第一次使用pandas,我不知道如何选择数据
reader = pd.read_csv(file_path, sep="\t" ,lineterminator='\r', usecols=[0,1,2,9,10],)
for row in reader:
print(row)
#id_number = row[0]
#name = row[2]
#ip_address = row[1]
#latitude = row[9]
这是我要分配给变量的行的输出:
050000
129.240.228.138
planetlab2.simula.no
59.93
编辑:也许这对熊猫来说不是问题,但对于一般的 Python 来说。我对python相当陌生,我想要实现的是逐行解析制表符分隔的文件并将数据分配给变量并在一个循环中打印它们。
这是输入文件示例:
050263 128.2.211.113 planetlab-1.cmcl.cs.cmu.edu NA US Allegheny County Pittsburgh http://www.cs.cmu.edu/ Carnegie Mellon University 40.4446 -79.9427 unknown
050264 128.2.211.115 planetlab-3.cmcl.cs.cmu.edu NA US Allegheny County Pittsburgh http://www.cs.cmu.edu/ Carnegie Mellon University 40.4446 -79.9427 unknown
【问题讨论】:
-
分配给变量是什么意思?单个数据点还是整列?为什么要这样做?每个都包含在一个数据框中,可以通过
.loc、.ix或[]引用。 -
我的意思是,在输入文件中,数据在每一行上都是制表符分隔的(id\taddress\tname\tlatitude 等)。我想逐行迭代并将数据分配给变量
-
reader 长什么样子?你想要的输出是什么?不太了解,因为 pandas 可以读取制表符分隔的文件。并且分配了列而不是行。
-
我想要的输出基本上就是我所说的逐行迭代文件并将每一行的数据分配给变量。然后打印它们。这必须在循环中完成。至于 Reader 那是我的错误,该变量应该称为 df。
-
还是不明白为什么。您可能不需要熊猫,但需要通用 python。 pandas Dataframe 中的每一列都是一个 pandas Series,它是一种类型(整数、字符串、日期时间),可以是您的 变量。按行分配结合了不同的类型,您将不再有系列来运行各种功能。您希望如何处理这些变量?请使用更多信息(输入和输出)编辑您的帖子,因为这将成为XY problem。