【发布时间】:2022-11-18 03:41:22
【问题描述】:
我正在尝试获取多个网页的名称,这是我拥有的数据集的示例:
c("https://arealdata-api.miljoeportal.dk/download/dai/BES_NATURTYPER_SHAPE.zip",
"https://download.kortforsyningen.dk/content/matrikelkortet",
"https://b0902-prod-dist-app.azurewebsites.net/geoserver/wfs",
"https://sit-ftp.statens-it.dk/main.html",
"https://arealdata.miljoeportal.dk/datasets/saerligtudpejede",
"https://miljoegis3.mim.dk/spatialmap?profile=privatskovtilskud",
"https://envs.au.dk/fileadmin/envs/Hjemmeside_2018/Zip_filer/Basemap03_public_geotiff.zip",
"https://arealdata-api.miljoeportal.dk/download/dai/BES_VANDLOEB_SHAPE.zip",
"https://wfs2-miljoegis.mim.dk/vp3basis2019/ows?service=WFS&version=1.0.0&request=GetCapabilities",
"httphttps://datasets.catalogue.data.gov.dk/dataset/ramsaromrader",
"https://ens.dk/service/statistik-data-noegletal-og-kort/download-gis-filer",
"https://miljoegis.mim.dk/cbkort?profile=miljoegis-raastofferhavet",
"https://www.marineregions.org/",
"https://CRAN.R-project.org/package=geodata>.",
"https://miljoegis3.mim.dk/spatialmap?profile=vandprojekter",
"https://landbrugsgeodata.fvm.dk/")
作为第一个入口的例子,我想获取网页“https://arealdata-api.miljoeportal.dk/”没有地址的其余部分,所以擦除“下载/dai/BES_NATURTYPER_SHAPE.zip”.
我在想一些东西,比如把所有东西都放在 https:// 和之后的第一个 / 之间。
这些是我到目前为止尝试过的变体:
# 1
URLS <- gsub(".*?//", "", URLS)
# 2
URLS <- gsub("http://", "", URLS)
# 3
URLS <- gsub(".*?//", "", URLS)
# 4
URLS <- gsub("/.*", "", URLS)
这些都不起作用。
【问题讨论】:
-
抱歉,我无法在链接的重复问题中找到该问题的答案?!有人可以指点我吗?否则,我主张取消删除@akrun 清楚地回答了这个问题的答案。