【发布时间】:2017-09-01 19:35:55
【问题描述】:
背景
联合国秘书长和其他机构每年向联合国大会发布数百份报告,这些报告并没有像其他文件那样的统一清单。但是,有一个简化的 URL 用于阅读这些报告,使用它们的文档代码 http://undocs.org/[document code] 和格式为 A/[Session]/[Document Number] 的文档代码。示例文档代码为“A/71/1”,访问它的 url 为“https://undocs.org/A/71/1”。
过去 15 年来我一直在尝试下载所有这些文档,但我不想手动输入每个文档,而是想设置一个 Google Apps 脚本来为我完成。
问题
例如,当我尝试使用简单方法UrlFetchApp.fetch("http://undocs.org/A/71/1"); 时,它会获取一个错误页面,指出我正在使用未经授权的方法访问该页面。如果您阻止 cookie 或有时您尝试在隐身窗口中访问该页面,则会显示此页面。
现在,我不想入侵联合国,而只是下载一些可供公众访问的 PDF。我需要弄清楚我需要使用.fetch() 方法传递什么样的参数才能让页面授权请求。
注意:我搜索了 undocs.org 网站以寻找任何指导,但没有找到。
tl;博士
尝试使用 Google Apps 脚本中的 UrlFetchApp 访问联合国官方文档系统,但我不知道如何获得授权请求。
【问题讨论】:
标签: google-apps-script urlfetch