【发布时间】:2021-01-11 23:07:50
【问题描述】:
假设我有一个这样的数据集
|-----------------|----------------|
| ID | Values |
|-----------------|----------------|
| 123 | aaaa |
|-----------------|----------------|
| 234 | bbb |
|-----------------|----------------|
| 123 | ab3d |
|-----------------|----------------|
| 264 | 34g3ff |
|-----------------|----------------|
| 783 | 341g5h |
|-----------------|----------------|
| 921 | 7jdfew |
|-----------------|----------------|
| 264 | 53fj |
|-----------------|----------------|
我想从不同的 ID 值中随机选择 3 个值。一种可能性是获得这样的表格
|-----------------|----------------|
| ID | Values |
|-----------------|----------------|
| 123 | aaaa |
|-----------------|----------------|
| 123 | ab3d |
|-----------------|----------------|
| 783 | 341g5h |
|-----------------|----------------|
| 921 | 7jdfew |
|-----------------|----------------|
我应该如何在 Hive 中做到这一点?
【问题讨论】:
标签: sql random hive subquery inner-join