【发布时间】:2018-01-11 05:20:11
【问题描述】:
这里有 Pandas 的新程序员。我正在将带有熊猫数据框的行分隔成新的数据框。我有一个看起来像这样的数据框:
In [1]: print (df)
first_name email organization
0 Brad brad@gmail.com org1
1 Jared jared@gmail.com org2
2 Daniel daniel@gmail.com org3
3 Michael michael@gmail.com org1
4 Jaime jaime@gmail.com org2
我想要做的是遍历数据帧中的每一行,确定该行属于哪个组织(例如,Brad 属于 org1,Daniel 属于 org3),然后我想将该行写入一个新的数据帧.在这种情况下,我想要 3 个新数据帧,每个数据帧如下所示:
组织 1:
In [3]: print (org1)
first_name email organization
0 Brad brad@gmail.com org1
1 Michael michael@gmail.com org1
组织2:
In [4]: print (org2)
first_name email organization
0 Jared jared@gmail.com org2
1 Jaime jaime@gmail.com org2
组织3:
In [3]: print (org3)
first_name email organization
0 Daniel daniel@gmail.com org3
如何创建一个循环遍历原始数据帧中的每一行,通过特定列中的值识别要写入的数据帧,然后将其实际写入数据帧?
循环第一次遇到该值时,我希望它创建一个全新的数据框。之后,任何具有相同值的后续行都应该添加到其中——而不是完全创建一个新行。任何帮助(以及理解循环如何在数据帧方面工作的智慧)将不胜感激。
【问题讨论】: