【发布时间】:2018-12-02 06:33:51
【问题描述】:
我有一个如下的熊猫数据框。
import pandas as pd
df1=pd.DataFrame({'Group1':['a','b','c','d','e'],'Group2':["f","g","h","i","j"],'Group3':['k','L','m','n',"0"]})
print(df1)
df2=pd.DataFrame({'Group1':[0,0,2,1,0],'Group2':[1,2,0,0,0],'Group3':[0,0,0,1,1]})
print(df2)
df1 是学生姓名的数据框。 df2 是他们的测试分数的数据框。
例如,如果我比较 df1 和 df2,g 和 c 的测试分数为 2。
n,o,f,d 的值为 1。
其余的值为 0。
我想比较df1和df2,然后提取学生的姓名和分数。
预期的输出数据帧如下所示。
df3=pd.DataFrame({'2':["g","c","NaN","NaN","NaN","NaN","NaN","NaN","NaN"],'1':["n","o","f","d","NaN","NaN","NaN","NaN","NaN"],'0':["k","L","m","h","i","j","a","b","e"]})
print(df3)
我的实际数据框比上述示例大得多,我想知道有什么好的方法可以在不指定单元格的情况下进行提取。 对你的帮助表示感谢。 谢谢。
【问题讨论】:
-
请说明您最初的努力以及哪里出了问题。
-
我不太清楚你想要达到什么目的。
标签: python pandas dataframe matrix