【问题标题】:If else statements for dates in RR中日期的if else语句
【发布时间】:2020-04-14 01:23:40
【问题描述】:

您好,我正在尝试在我的数据框中创建一个新列来表示“如果 'SightDate' 介于 7-15 和 2-15 之间,则返回 TRUE 1 否则为 FALSE [0]”,但似乎找不到r 中日期函数的语法。这就是我到目前为止所拥有的。

#convert SightDate to Month-Day
sightingsData$SightMonthDay <- strptime(as.character(sightingsData$SightDate), "%m/%d/%Y")
sightingsData$SightMonthDay <- format.Date(sightingsData$SightMonthDay, "%m-%d")

#Get whether or not sighting occured during the proposed work period
startWork <- as.Date("07-15", format = "%m-%d")
endWork <- as.Date("02-15", format = "%m-%d")

sightingsData$WorkPeriod = ifelse(sightingsData$SightMonthDay >= startWork & sightingsData$SightMonthDay <= endWork, 1, 0)

我收到这个错误

Error in charToDate(x) : 
  character string is not in a standard unambiguous format

我不知道为什么,因为当我取出逗号时,我得到的是“意外数字 1”。

此外,我正在尝试使用我在论坛上找到的功能为我的数据分配季节。但我在 R 中为日期分配而苦苦挣扎,似乎无法理解它。我希望能够将季节分配包含在标题为“SightSeason”或类似名称的新列中。

sightingsData$sightSeason <- getSeason(sightingsData$SightMonthDay)

但似乎看不到我将在下面的函数中解释它的位置......在我将SightingsData$SightData 转换为2016 值之前或之后或之后。这让我犹豫不决,我想知道是否应该创建一个中间列,我可以在其中存储我的sightingsData$SightDate 到2016 值的转换——比如,singingsData$2016Sight,这样我就不会永久改变我的df。我不是很清楚这一点。我为漫无目的道歉,但我不确定如何澄清我的问题。任何人,这是“获取季节功能”:

### Assign SightMonthDay to Season using 2016 Season Data
getSeason <- function(DATES)
  WS <- as.Date("2016-12-21", format = "%Y-%m-%d") # Winter Solstice
  SE <- as.Date("2016-3-19",  format = "%Y-%m-%d") # Spring Equinox
  SS <- as.Date("2016-6-20",  format = "%Y-%m-%d") # Summer Solstice
  FE <- as.Date("2016-9-22",  format = "%Y-%m-%d") # Fall Equinox

# Convert dates from any year to 2016 dates
d <- as.Date(strftime(DATES, format="2016-%m-%d"))

ifelse (d >= WS | d < SE, "Winter",
        ifelse (d >= SE & d < SS, "Spring",
                ifelse (d >= SS & d < FE, "Summer", "Fall")))

任何关于我如何应用该功能的见解,或者如果您知道将季节分配给我的数据集的不同方法,将不胜感激!澄清一下,我使用 2016 年是因为它是最后一个闰年,有完整的冬至和春分数据。

这是我的数据的 20 次观察随机样本:

       SightDate SightMonthDay
17092 10/23/2017         10-23
129    3/13/2009         03-13
20671  1/17/2018         01-17

以及 dput(SampleData) 的输出

> dput(droplevels(SampleData[1:20, ]))
structure(list(SightDate = structure(c(1L, 16L, 18L, 7L, 8L, 
19L, 10L, 6L, 9L, 14L, 13L, 5L, 15L, 2L, 3L, 17L, 4L, 11L, 12L, 
20L), .Label = c("10/13/2015", "10/28/2017", "11/10/2018", "11/2/2018", 
"11/29/2012", "12/14/2017", "12/21/2013", "12/3/2016", "12/5/2017", 
"3/14/2016", "3/22/2015", "3/25/2011", "4/15/2018", "4/4/2014", 
"5/1/2017", "6/26/2016", "8/18/2015", "9/15/2017", "9/18/2015", 
"9/18/2017"), class = "factor"), SightMonthDay = c("10-13", "06-26", 
"09-15", "12-21", "12-03", "09-18", "03-14", "12-14", "12-05", 
"04-04", "04-15", "11-29", "05-01", "10-28", "11-10", "08-18", 
"11-02", "03-22", "03-25", "09-18")), row.names = c(9977L, 11703L, 
15804L, 6177L, 12954L, 9707L, 10774L, 19559L, 18897L, 6546L, 
21349L, 4797L, 14169L, 17403L, 23014L, 9410L, 22758L, 8440L, 
2854L, 15886L), class = "data.frame")

抱歉,我不太清楚如何发布我的数据样本供其他人操作。

感谢您的宝贵时间!

【问题讨论】:

  • 您能否包含一个具有少量行和相关列的小型可重现示例,并基于此显示预期输出?屏幕截图对处理没有帮助。可能你只想要sightingsData$SightSeason &lt;- getSeason(sightingsData$SightMonthDay)
  • @RonakShah,是的,这就是我的设想,但似乎无法弄清楚在 getSeason 函数中将其包含在何处,在我将SightingsData$SightDate 转换为季节之前或之后.. . 为了清楚起见,我会更新我的帖子。
  • 对于第一种情况,您应该使用ifelse 而不是if
  • 正如@RonakShah 建议的那样,如果您提供您的数据以便我们检查我们的结果,例如dput(sightingsData[1:20,]),那么提供帮助会容易得多。您可以使用输出编辑原始帖子。
  • @RonakShah 抱歉,我必须做一些研究才能弄清楚如何在不超过帖子字符限制的情况下包含 dput 输出。我已经将我的数据的 20 个观察随机样本包含在内,其中只有目击数据和日月列,因为这些是我主要在脚本中调用的那些。如果由于某种原因需要另一个变量,请告诉我!非常感谢您的帮助!

标签: r if-statement dplyr lubridate as.date


【解决方案1】:

您不需要SightMonthDay 列。

#Function to get season
getSeason <- function(d) {
   WS <- as.Date("2016-12-21") # Winter Solstice
   SE <- as.Date("2016-3-19") # Spring Equinox
   SS <- as.Date("2016-6-20") # Summer Solstice
   FE <- as.Date("2016-9-22") # Fall Equinox

 ifelse (d >= WS | d < SE, "Winter",
      ifelse (d >= SE & d < SS, "Spring",
              ifelse (d >= SS & d < FE, "Summer", "Fall")))
}
#Change to standard date format
SampleData$date <- as.Date(SampleData$SightDate, format = '%m/%d/%Y')
#Make date of the same year i.e 2016
SampleData$date <- as.Date(format(SampleData$date, "2016-%m-%d"))
#Get season for each date. 
SampleData$SightSeason <- getSeason(SampleData$date)

head(SampleData)
#       SightDate       date SightSeason
#9977  10/13/2015 2016-10-13        Fall
#11703  6/26/2016 2016-06-26      Summer
#15804  9/15/2017 2016-09-15      Summer
#6177  12/21/2013 2016-12-21      Winter
#12954  12/3/2016 2016-12-03        Fall
#9707   9/18/2015 2016-09-18      Summer

【讨论】:

    猜你喜欢
    • 2012-09-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-09-06
    相关资源
    最近更新 更多