【发布时间】:2020-01-23 12:51:30
【问题描述】:
嘿,
为了比较几种不同的数据,我制作了一份 HTML 报告。
给定一个特殊的类别,数据库中的一些索引应该是相同的。为了检测数据库中的错误/不正确的条目,我比较了表中的不同类别。
为了更好地阅读,最好有彩色表格。这可以通过formattable-Package 轻松完成。
我的数据集:
require(tidyverse)
require(formattable)
require(kableExtra)
require(knitr)
df1 <- data.frame(V1 = c(68,sample(c("J","N"),size=15,replace = TRUE)),
V2 = c(10,sample(c("J","N"),size=15,replace = TRUE)),
V3 = c(1,sample(c("J","N"),size=15,replace = TRUE))
)
它有 - 在这个例子中 - 3 个不同的变体。只推荐一个。假设具有最高 N 的变体(=每个 Vx 列中的第一个条目)是真实的。
我的格式化表格是用这个代码生成的:
df1 %>%
mutate(
V2 = ifelse((as.character(V2) == as.character(V1)) == FALSE,
cell_spec(V2, color = "red",bold = TRUE),
cell_spec(V2, color = "black",bold = FALSE)),
V3 = ifelse((as.character(V3) == as.character(V1)) == FALSE,
cell_spec(V3, color = "red",bold = TRUE),
cell_spec(V3, color = "black",bold = FALSE))
) %>%
kable(format = "html", escape = FALSE) %>%
kable_styling(c("striped", "condensed"), full_width = FALSE) %>%
row_spec(1, bold = T, color = "white", background = "#D7261E")
两个问题:
- 如何循环
mutate?
这是必要的,因为我必须调查的不同类别最多可以有 18 个不同的变体。在每个数据集中,V1 每次都是参考变体。
- 如您所见(运行代码!)第一行(“N”)编码错误。是否可以仅从第二行开始比较(第一行默认设置为 TRUE)
这样就好了,因为第一行现在的格式并不真正有意义。
谢谢!
【问题讨论】:
标签: r dplyr kableextra formattable