【发布时间】:2017-07-04 09:28:57
【问题描述】:
我想使用 R 的网站。该网站是 http://soundoftext.com/,我可以在其中下载 WAV。带有来自给定文本和语言(语音)的音频的文件。
下载WAV语音有两个步骤: 1) 插入文本并选择语言。并提交 2) 在新窗口中,点击保存并选择文件夹。
到目前为止,我可以获取 xml 树,将其转换为列表并修改文本和语言的值。但是,我不知道如何将列表转换为 XML(使用新值)并执行它。然后,我也需要做第二步。
到目前为止,这是我的代码:
require(RCurl)
require(XML)
webpage <- getURL("http://soundoftext.com/")
webpage <- readLines(tc <- textConnection(webpage)); close(tc)
pagetree <- htmlTreeParse(webpage, error=function(...){}, useInternalNodes = TRUE)
x<-xmlToList(pagetree)
# Inserting word
x$body$div$div$div$form$div$label$.attrs[[1]]<-"Raúl"
x$body$div$div$div$form$div$label$.attrs[[1]]
# Select language
x$body$div$div$div$form$div$select$option$.attrs<-"es"
x$body$div$div$div$form$div$select$option$.attrs
我已遵循this 方法,但“标签”出现错误。
更新:我只是尝试使用 rvest 下载音频文件,但是,它没有响应或触发任何东西。我做错了什么(失踪)?
url <- "http://soundoftext.com/"
s <- html_session(url)
f0 <- html_form(s)
f1 <- set_values(f0[[1]], text="Raúl", lang="es")
attr(f1, "type") <- "Submit"
s[["fields"]][["submit"]] <- f1
attr(f1, "Class") <- "save"
test <- submit_form(s, f1)
【问题讨论】:
-
你可能会用
rvest包和它的html_form函数玩得更好 -
谢谢@GGamba。我已根据您的建议使用代码修改了帖子。但是,它仍然不起作用。我做错了什么?