【发布时间】:2017-10-24 22:33:43
【问题描述】:
我有一个按以下顺序排序的电子邮件元数据表,其中我知道数据已排序,并且每次出现“发件人”意味着下一组条目代表另一封电子邮件的属性。
该列的重复模式如下:
==============
Tag
==============
From
Recepient
CC_Recepient
CC_Recepient
Subject
From
Recepient
CC_Recepient
Subject
From
Recepient
Subject
From
etc..
==============
我需要创建第二列,它是每个与电子邮件相关的条目组的唯一标识符,如下所示。重复出现“From”是我必须确定下一组条目开始的唯一方法。
<table><tbody><tr><th>Tag </th><th>Identifier</th></tr><tr><td>From </td><td>1</td></tr><tr><td>Recepient </td><td>1</td></tr><tr><td>CC_Recepient </td><td>1</td></tr><tr><td>CC_Recepient </td><td>1</td></tr><tr><td>Subject</td><td>1</td></tr><tr><td>From </td><td>2</td></tr><tr><td>Recepient</td><td>2</td></tr><tr><td>CC_Recepient</td><td>2</td></tr><tr><td>Subject</td><td>2</td></tr><tr><td>From</td><td>3 </td></tr><tr><td>Recepient</td><td>3</td></tr><tr><td>Subject</td><td>3</td></tr><tr><td>From</td><td>4</td></tr><tr><td>etc..</td><td> </td></tr></tbody></table>
【问题讨论】:
标签: r dplyr data.table