【发布时间】:2020-10-20 16:35:28
【问题描述】:
我有一组字符串,我需要从中构造 DataFrame 中的主要指标变量列。有没有办法在 Python pandas 中进行这种维度扩展?
例如如果我有这两组:
los = set(["abc", "def"])
his = set(["X", "Y", "Z"])
我希望得到一个包含所有集合组合的 DataFrame。像这样:
import pandas as pd
df = pd.DataFrame({"los": ["abc", "abc", "abc", "def", "def", "def"], "his": ["X", "Y", "Z", "X", "Y", "Z"]})
理想情况下,我希望它可以轻松推广到任意数量的集合。
【问题讨论】:
-
您希望输出数据帧是什么样子的?是否要将“los”和“his”作为列标题?在您提供的情况下,由于 los 的组合数超过了 his 的组合数,因此列的长度会有所不同。您希望用 NaN 或空字符串填充多余的行吗?
-
我不确定我是否理解您的意思?生成的 DataFrame 正如我所说的那样。