【发布时间】:2021-12-01 23:11:06
【问题描述】:
我有一个数据框:
| State | County | Candidate | CandidateVotes | Mode |
|---|---|---|---|---|
| South Carolina | Beaufort | Joe Biden | 13713 | ABSENTEE BY MAIL |
| South Carolina | Beaufort | Joe Biden | 63 | FAILSAFE |
| South Carolina | Beaufort | Joe Biden | 33 | FAILSAFE PROVISIONAL |
| South Carolina | Beaufort | Donald Trump | 9122 | ABSENTEE BY MAIL |
| South Carolina | Beaufort | Donald Trump | 26495 | ELECTION DAY |
| South Carolina | Beaufort | Donald Trump | 42 | FAILSAFE PROVISIONAL |
| Pennsylvania | York | Donald Trump | 146733 | TOTAL |
| Pennsylvania | York | Joe Biden | 88114 | TOTAL |
模式可以是各种各样的东西,但总票数将始终是该候选人列的总数。此外,一些州/县将保留总数而不是分解所有内容。我要做的与底部列出的宾夕法尼亚州相同。
这是我想要的输出:
| State | County | Candidate | CandidateVotes | Mode |
|---|---|---|---|---|
| South Carolina | Beaufort | Joe Biden | 13809 | TOTAL |
| South Carolina | Beaufort | Donald Trump | 26537 | TOTAL |
| Pennsylvania | York | Donald Trump | 146733 | TOTAL |
| Pennsylvania | York | Joe Biden | 88114 | TOTAL |
我认为正确的做法是按州、县和候选人分组。从这里,为相应的候选人添加所有模式,并使用该总数创建一个新列。如果 Mode = 'TOTAL',只需将其移至新列,然后删除 Mode。
我该怎么做?
【问题讨论】: