【发布时间】:2019-03-02 19:58:03
【问题描述】:
我的数据集有一列包含多个值,由 ; 分隔。
name sex good_at
1 Tom M Drawing;Hiking
2 Mary F Cooking;Joking
3 Sam M Running
4 Charlie M Swimming
我想为good_at 中的每个唯一值创建一个虚拟变量,这样每个虚拟变量都包含一个TRUE 或FALSE,以指示该个人是否拥有该特定值。
期望的输出
Drawing Cooking
True False
False True
False False
False False
【问题讨论】:
-
我需要解决的问题是现有变量包含多个信息,例如绘图+徒步旅行。我必须在谷歌表中使用像 REGEXMATCH 这样的函数,但我不知道如何在 R 中编码。@CristianE.Nuno
-
啊,我现在明白了。你的问题不一样。谢谢你的澄清。
标签: r reshape dummy-variable one-hot-encoding