【发布时间】:2019-01-09 23:17:56
【问题描述】:
我有一个跨多个测量周期跟踪父/子关系的数据集。这看起来像
[["Col1","Col2"],
["A","B"],
["B","C"],
["C","D"]]
我希望它显示为
[["Col1","Col2","Col3","Col4"],
["A","B","C","D"]]
我在 SQL 中看到过其他示例,但这些示例似乎都没有回答我的问题。我正在寻找数据的完整列扩展。
我研究了自连接和转置,但这些都没有让我明白。
这不需要超专业的 python 包,因为我需要将它移植到其他一些编码语言。
更新:第二个例子: 如果我有一个数据集,例如
[["Col1","Col2"],
["A","B1"],
["B1","C1"],
["B1,"C2"],
["C2,"D"],
["A,"B2"]]
我希望:
[["Col1","Col2","Col3","Col4"],
["A","B1","C1",""],
["A","B1","C2","D"],
["A","B2","",""]]
【问题讨论】:
-
我喜欢您保持其通用性,但您的示例最终可能过于简单化,并产生可能不完全适用的答案。您是否希望您的数据在第一个索引中作为列名提供,而在第二个索引中仅作为值提供?可以这么说,这些价值观是否倾向于在“尾巴”处加入?这可能太模糊了。
-
col3和col4?他们是从哪里来的? -
@ParitoshSingh - 好点。索引和列名不如列的顺序重要。应该在尾部和头部连接,因为第一列中的第一项可能不是真正的头部,但实际上是“本地头部”。相反,我需要从某个任意值向前和向后移动。
-
请用文字准确地解释你在做什么。请通过帖子编辑进行澄清,而不是 cmets。
标签: python recursion transpose self-join