【发布时间】:2020-04-14 01:23:40
【问题描述】:
您好,我正在尝试在我的数据框中创建一个新列来表示“如果 'SightDate' 介于 7-15 和 2-15 之间,则返回 TRUE 1 否则为 FALSE [0]”,但似乎找不到r 中日期函数的语法。这就是我到目前为止所拥有的。
#convert SightDate to Month-Day
sightingsData$SightMonthDay <- strptime(as.character(sightingsData$SightDate), "%m/%d/%Y")
sightingsData$SightMonthDay <- format.Date(sightingsData$SightMonthDay, "%m-%d")
#Get whether or not sighting occured during the proposed work period
startWork <- as.Date("07-15", format = "%m-%d")
endWork <- as.Date("02-15", format = "%m-%d")
sightingsData$WorkPeriod = ifelse(sightingsData$SightMonthDay >= startWork & sightingsData$SightMonthDay <= endWork, 1, 0)
我收到这个错误
Error in charToDate(x) :
character string is not in a standard unambiguous format
我不知道为什么,因为当我取出逗号时,我得到的是“意外数字 1”。
此外,我正在尝试使用我在论坛上找到的功能为我的数据分配季节。但我在 R 中为日期分配而苦苦挣扎,似乎无法理解它。我希望能够将季节分配包含在标题为“SightSeason”或类似名称的新列中。
sightingsData$sightSeason <- getSeason(sightingsData$SightMonthDay)
但似乎看不到我将在下面的函数中解释它的位置......在我将SightingsData$SightData 转换为2016 值之前或之后或之后。这让我犹豫不决,我想知道是否应该创建一个中间列,我可以在其中存储我的sightingsData$SightDate 到2016 值的转换——比如,singingsData$2016Sight,这样我就不会永久改变我的df。我不是很清楚这一点。我为漫无目的道歉,但我不确定如何澄清我的问题。任何人,这是“获取季节功能”:
### Assign SightMonthDay to Season using 2016 Season Data
getSeason <- function(DATES)
WS <- as.Date("2016-12-21", format = "%Y-%m-%d") # Winter Solstice
SE <- as.Date("2016-3-19", format = "%Y-%m-%d") # Spring Equinox
SS <- as.Date("2016-6-20", format = "%Y-%m-%d") # Summer Solstice
FE <- as.Date("2016-9-22", format = "%Y-%m-%d") # Fall Equinox
# Convert dates from any year to 2016 dates
d <- as.Date(strftime(DATES, format="2016-%m-%d"))
ifelse (d >= WS | d < SE, "Winter",
ifelse (d >= SE & d < SS, "Spring",
ifelse (d >= SS & d < FE, "Summer", "Fall")))
任何关于我如何应用该功能的见解,或者如果您知道将季节分配给我的数据集的不同方法,将不胜感激!澄清一下,我使用 2016 年是因为它是最后一个闰年,有完整的冬至和春分数据。
这是我的数据的 20 次观察随机样本:
SightDate SightMonthDay
17092 10/23/2017 10-23
129 3/13/2009 03-13
20671 1/17/2018 01-17
以及 dput(SampleData) 的输出
> dput(droplevels(SampleData[1:20, ]))
structure(list(SightDate = structure(c(1L, 16L, 18L, 7L, 8L,
19L, 10L, 6L, 9L, 14L, 13L, 5L, 15L, 2L, 3L, 17L, 4L, 11L, 12L,
20L), .Label = c("10/13/2015", "10/28/2017", "11/10/2018", "11/2/2018",
"11/29/2012", "12/14/2017", "12/21/2013", "12/3/2016", "12/5/2017",
"3/14/2016", "3/22/2015", "3/25/2011", "4/15/2018", "4/4/2014",
"5/1/2017", "6/26/2016", "8/18/2015", "9/15/2017", "9/18/2015",
"9/18/2017"), class = "factor"), SightMonthDay = c("10-13", "06-26",
"09-15", "12-21", "12-03", "09-18", "03-14", "12-14", "12-05",
"04-04", "04-15", "11-29", "05-01", "10-28", "11-10", "08-18",
"11-02", "03-22", "03-25", "09-18")), row.names = c(9977L, 11703L,
15804L, 6177L, 12954L, 9707L, 10774L, 19559L, 18897L, 6546L,
21349L, 4797L, 14169L, 17403L, 23014L, 9410L, 22758L, 8440L,
2854L, 15886L), class = "data.frame")
抱歉,我不太清楚如何发布我的数据样本供其他人操作。
感谢您的宝贵时间!
【问题讨论】:
-
您能否包含一个具有少量行和相关列的小型可重现示例,并基于此显示预期输出?屏幕截图对处理没有帮助。可能你只想要
sightingsData$SightSeason <- getSeason(sightingsData$SightMonthDay) -
@RonakShah,是的,这就是我的设想,但似乎无法弄清楚在 getSeason 函数中将其包含在何处,在我将SightingsData$SightDate 转换为季节之前或之后.. . 为了清楚起见,我会更新我的帖子。
-
对于第一种情况,您应该使用
ifelse而不是if。 -
正如@RonakShah 建议的那样,如果您提供您的数据以便我们检查我们的结果,例如
dput(sightingsData[1:20,]),那么提供帮助会容易得多。您可以使用输出编辑原始帖子。 -
@RonakShah 抱歉,我必须做一些研究才能弄清楚如何在不超过帖子字符限制的情况下包含 dput 输出。我已经将我的数据的 20 个观察随机样本包含在内,其中只有目击数据和日月列,因为这些是我主要在脚本中调用的那些。如果由于某种原因需要另一个变量,请告诉我!非常感谢您的帮助!
标签: r if-statement dplyr lubridate as.date