【发布时间】:2021-07-27 18:13:20
【问题描述】:
我有一个包含 3 列的边缘列表,类似于 From、To、Weight,但它没有行/列名称。
A1 B1 0.3
A1 B2 0.2
A1 B3 0.1
A2 B1 0.3
A2 B2 0.2
A2 B3 0.3
... ...
更多细节:Col 1 只有“Ax”,col 2 只有“Bx”,它们是不同的类型。在 Ax 和 Bx 中永远不会有真正的十字架,例如永远不会有这样的一行
A1 A3 0.2
此外,生成的邻接矩阵应该是完全正方形的,A 的数量与 B 的数量完全相同,并且每个 A 恰好映射到每个 B,反之亦然。
跟随其他stackoverflow线程,我已经申请了
library(igraph)
gdf <- graph.data.frame(edgelist)
adj_mat <- get.adjacency(gdf, sparse = FALSE, attr='X3')
但是,这个输出充满了 Ax-Ax 和 Bx-Bx 对,即
A1 A2 A3
A1 0 0 0
A2 0 0 0
A3 0 0 0
在继续之前(这也是我想要的结果,没有前导和尾随的 0 块)
... A1 A2 A3
B1 0.3 0.3 ...
B2 0.2 0.2 ...
B3 0.1 0.3 ...
后面是一大块 0 和 Bx-Bx 交叉。
所以这个矩阵大约是它需要的大小的 3 倍。
我在 R 中的实际 adj_mat 输出,以防万一:
query_0 query_1 query_2 query_3 query_4 query_5 query_6 query_7 reference_B reference_CD4_T
query_0 0 0 0 0 0 0 0 0 0.9211076 0.9357135
query_1 0 0 0 0 0 0 0 0 0.5982098 0.6531529
query_2 0 0 0 0 0 0 0 0 0.9414440 0.9163261
query_3 0 0 0 0 0 0 0 0 0.7776452 0.7595893
query_4 0 0 0 0 0 0 0 0 0.1742785 0.4535070
query_5 0 0 0 0 0 0 0 0 0.8929904 0.8692392
query_6 0 0 0 0 0 0 0 0 0.8727388 0.9143452
query_7 0 0 0 0 0 0 0 0 0.6672841 0.7709745
reference_B 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_CD4_T 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_CD8_T 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_DC 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_Mono 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_NK 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_other 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_other_T 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_CD8_T reference_DC reference_Mono reference_NK reference_other reference_other_T
query_0 0.9795670 0.9616339 0.2036382 0.9735171 0.9868448 0.9683900
query_1 0.9581395 0.9263749 0.8985018 0.8132070 0.7481512 0.9580464
query_2 0.4993608 0.3923397 0.9837582 0.9125077 0.9859413 0.9322740
query_3 0.9069418 0.8334141 0.9652273 0.1926747 0.9856065 0.9556887
query_4 0.9415359 0.8987213 0.9075660 0.7965302 0.9804007 0.9542930
query_5 0.3971887 0.5269301 0.9410492 0.9178430 0.9854246 0.6326137
query_6 0.9752365 0.9528309 0.9084781 0.9701409 0.9274201 0.9644051
query_7 0.9712323 0.9535511 0.9000940 0.9376305 0.8200538 0.9356329
reference_B 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_CD4_T 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_CD8_T 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_DC 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_Mono 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_NK 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_other 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_other_T 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
在这种特殊情况下,我可以得到我想要的结果
adj_mat<- adj_mat[, -c(1:8)]
adj_mat<- adj_mat[-c(9:16),]
但我希望找到更通用的东西。
我不必严格使用igraph 包,我愿意使用任何其他包将边缘列表转换为邻接矩阵,甚至只是魔术数据争吵。
【问题讨论】:
-
你想重塑数据吗?
tidyr::pivot_wider(df, names_from = From, values_from = Weight)。也可以在这里查看各种选项stackoverflow.com/questions/5890584/…
标签: r igraph adjacency-matrix adjacency-list