【发布时间】:2019-05-13 18:43:11
【问题描述】:
我正在使用 v7.0 的 DataFrames.jl 并且想知道这是否是一种连接两个 DataFrames 的方法,这样两个 DataFrames 共有的所有列都连接在一起,而列之间不共有DataFrames 都被标记为缺失。
join() 函数似乎为DataFrame 创建了一个新密钥。
如果没有完全相同的列名,vcat 函数似乎无法连接 DataFrames。
我在下面的意思的一个例子。
我想合并
df1 = DataFrame(
A = [1, 1000, 10000, 100000],
B = [1,2,3,4],
D = ["N", "M", "I", "J"])
df2 = DataFrame(
A = [1,2],
B = repeat(1:2, inner=1),
C = ["hi","CE"])
以某种方式让我得到
df3 = DataFrame(
A = [1,1000,10000,100000, 2],
B = [1,2,3,4,2],
C = ["hi", missing, missing, missing, "CE"],
D = ["N", "M", "I", "J", missing])
我想用大的DataFrames 来做这个,所以手动添加密钥是不可行的。
【问题讨论】:
-
听起来您想要完全加入。请问为什么
join()不适合你?另外,您使用的是哪个版本的 Julia?
标签: dataframe join concatenation julia