【发布时间】:2020-03-14 23:34:57
【问题描述】:
我有以下 Netflix 实验代码,以降低 Netflix 的价格,看看人们看电视是多还是少。每次有人使用 Netflix 时,它都会显示他们观看的内容以及观看时长。
**library(tidyverse)
sample_size <- 10000
set.seed(853)
viewing_data <-
tibble(unique_person_id = sample(x = c(1:100),
size = sample_size,
replace = TRUE),
tv_show = sample(x = c("Broadchurch", "Duty-Shame", "Drive to Survive", "Shetland", "The Crown"),
size = sample_size,
replace = TRUE),
)**
然后我想编写一些代码,将人们随机分配到两组中的一组 - 治疗组和控制组。但是,数据集位于行级别,因为有 1000 个观察值。我想将其更改为 R 中的人员级别,然后我可以签署一个人是否接受治疗。一个人不应该既被治疗又不被治疗。但是,tv_show 为一个人播放了很多次。有谁知道在这种情况下如何重塑数据集?
【问题讨论】:
-
您希望处理和未处理的数量相等吗?