【发布时间】:2025-12-19 05:05:11
【问题描述】:
我正在尝试从 IMDB 抓取 2019 年的电影。我正在从嵌套列表中提取导演的姓名。 现在,问题是导演的名字不是针对所有电影,而是针对少数电影,因此我需要在出现“导演:\n”一词的地方提取导演的名字。
嵌套列表如下:
[[1]]
[1] "Henry Cavill,Freya Allan,Anya Chalotra,Mimi Ndiweni\n"
[[2]]
[1] "\n"
[2] "Director:\nJ.J. Abrams"
[3] "|"
[4] "Stars:\nCarrie Fisher,Mark Hamill,Adam Driver,Daisy Ridley\n"
[[3]]
[1] "Pedro Pascal,Carl Weathers,Rio Hackford,Gina Carano\n"
[[4]]
[1] "\n"
[2] "Director:\nTom Hooper"
[3] "|"
[4] "Stars:\nFrancesca Hayward,Taylor Swift,Laurie Davidson,Robbie Fairchild\n"
[[5]]
[1] "Guy Pearce,Andy Serkis,Stephen Graham,Joe Alwyn\n"
[[6]]
[1] "\n"
[2] "Director:\nMichael Bay"
[3] "|"
[4] "Stars:\nRyan Reynolds,Mélanie Laurent,Manuel Garcia-Rulfo,Ben Hardy\n"
这里可以看到,导演的名字以另一种方式出现,但这只是为了举例。提前致谢。
预期输出:
directors_data NA,"J.J.艾布拉姆斯",NA,"迈克尔贝"
【问题讨论】:
-
您能否使用
dput共享数据并显示给定示例的预期输出?我的意思是在没有“导演”一词的地方,您需要NA还是完全忽略该条目? -
我想要 NA 以便最终数据帧没有行计数问题。
-
为什么“Tom Hooper”不在所需的输出中?