【发布时间】:2017-11-02 19:42:55
【问题描述】:
我想将一些字符串重新编码为二进制模式,以便在 R 中将它们编码为矩阵。假设我在数据框中有以下字符串:
strings code
ABC 1
BCA 2
CAB 1
提取它们后,我有以下字符串:
“ABC” “BCA” “驾驶室”
我想实现下一个转换:
A = 100
B = 010
C = 001
这样将“ABC”转换为下一个矩阵
100
010
001
于是,“BCA”变成了:
010
001
100
和“CAB”成:
001
100
010
并且,经过这个转换,得到一个“ABC”的向量,即:
100010001
代表ABC,以此类推。
基本上,我想做的是为字母字符定义一个带有二进制字典的算法,以便它使用 R 将每个字母转换为二进制序列。
我尝试了一些方法,但无法获得好的功能...
有什么帮助吗?
【问题讨论】: