【问题标题】:working on search queries in R在 R 中处理搜索查询
【发布时间】:2016-12-30 12:46:49
【问题描述】:

我是 R 新手,但尝试分析数据集 这里是原链接https://cache-default03g.cdn.yandex.net/download.yandex.ru/company/jobs/test_data_dreams.txt

我的代码是(我使用 R Studio 0.99.903 和 R 3.3.1)

# get the data from url url <- "https://cache- default03g.cdn.yandex.net/download.yandex.ru/company/jobs/test_data_dreams.txt" testdata <-read.table(url, header = T, sep="\t") #install packages for text mining to analyze the queries install.packages("slam") install.packages("tm") library(tm) #convert unix to GMT testdata$timestamp..unix. <- as.POSIXct(as.numeric(as.character(testdata$timestamp..unix.)),origin="1970-01-01",tz="GMT") #delete some words testdata$query <- gsub("к чему снится ", "\\1", testdata$query) testdata$query <- gsub("к чему сниться ", "\\1", testdata$query) testdata$query <- gsub(" к чему снится", "\\1", testdata$query) testdata$query <- gsub(" к чему сниться", "\\1", testdata$query) testdata$query <- gsub("снится ", "\\1", testdata$query) testdata$query <- gsub(" к чему", "\\1", testdata$query)'

现在我的数据框看起来是这样的。

> head(testdata) timestamp..unix. query city 1 2016-02-04 10:15:13 волна вынесла на берег Москва 2 2016-02-24 10:28:53 бегать наперегонки Екатеринбург 3 2016-02-07 15:31:51 свадьба мужчине со своей женой Владикавказ 4 2016-02-05 08:06:24 иголка медицинская Тамбов 5 2016-02-16 15:21:16 давняя знакомая Калининград 6 2016-02-27 03:38:46 белый маленький котенок Новосибирск

现在我正在尝试绘制查询,以查看它们在白天(也包括在一个月内)的总体分布情况以及我拥有的每个城市的分布情况。

您能否帮助我使用我应该选择分别读取日期和时间的工具,并且不绘制查询本身,而只是绘制查询的分布。

谢谢!

【问题讨论】:

  • 嗨@Yevgenyia,欢迎来到堆栈溢出。为了获得您需要的帮助,您发布的问题应该包含您正在使用的数据集的示例(或者只是其中的一部分,如果它太大),您为解决问题所做的尝试和代码你用过。请查看how to make a great R reproducible example 上的以下链接。如果您编辑您的问题,我相信我们可以帮助您:)
  • @thepule 谢谢你的链接!它让一切变得更容易理解)

标签: r plot timestamp searchqueryset


【解决方案1】:

您可以使用 lubridate 包,很容易从您的日期中提取日期和小时,然后对它们进行测试。例如:

 # Add a column for day
df$day <- day(df$timestampcol)

# Add a column for the hour
df$hour <- hour(df$timestampcol)

对于情节我推荐你ggplot2包,here你会找到一个绘制时间序列的例子。

【讨论】:

    猜你喜欢
    • 2017-01-24
    • 2013-12-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-01-29
    • 1970-01-01
    • 2018-05-01
    • 1970-01-01
    相关资源
    最近更新 更多