【发布时间】:2021-07-02 03:19:04
【问题描述】:
我有带有数据的汽车表
| country | car | price |
|---|---|---|
| Germany | Mercedes | 30000 |
| Germany | BMW | 20000 |
| Germany | Opel | 15000 |
| Japan | Honda | 20000 |
| Japan | Toyota | 15000 |
我需要从表格中获取国家、汽车和价格,每个国家的最高价格
| country | car | price |
|---|---|---|
| Germany | Mercedes | 30000 |
| Japan | Honda | 20000 |
我看到了类似的问题,但 SQL 中有解决方案,我想要 PySpark 数据帧的 DSL 格式(链接以防万一:Get records based on column max value)
【问题讨论】: