【发布时间】:2021-08-08 02:32:42
【问题描述】:
我正在使用以下方法下载大量文件,我担心它的内存使用情况。
Chrome's Blob Storage System Design 文档提到以下内容。
如果 blob 的内存空间已满,或者新的 blob 太大而无法在内存中,则 blob 系统会使用磁盘。这可以将旧的 blob 分页到磁盘,或者将新的太大的 blob 直接保存到磁盘。
但是,即使在多次阅读文档后,我仍然有以下顾虑:
- 我仍然不确定使用 fetch 会影响此行为并首先将数据加载到内存中。
- 如果 fetch 实际上改变了这种行为,是否有推荐用于此方法的文件大小限制(并且不应下载超过该大小的任何文件)?
- 在其他(非基于 Chromium 的浏览器)中会有什么行为?
const download = downloadLinks => {
const _download = async ( downloadLink ) => {
const blobURL = await fetch(downloadLink, {
responseType: 'blob'
})
.then(res => res.blob())
.then(blob => window.URL.createObjectURL(blob))
const fileName = downloadLink.substr(downloadLink.lastIndexOf('/'))
const a = document.createElement('a')
a.href = blobURL
a.setAttribute('download', fileName)
document.body.appendChild(a)
a.click()
a.remove()
window.URL.revokeObjectURL(blobURL)
}
const downloadInterval = () => {
if (downloadLinks.length == 0) return
const url = downloadLinks.pop()
_download(url)
if (downloadLinks.length !== 0) setTimeout(downloadInterval, 500)
}
setTimeout(downloadInterval, 0)
}
以下是我浏览过的一些资源。这些回答了所有这三个问题的一部分,但我有点太担心如果 Blob 首先加载到内存中,fetch 可能会产生什么影响。
【问题讨论】:
-
你为什么还要通过 fetch 呢?如果我正确阅读了您的代码,它的作用是首先在某个地址获取资源,然后生成一个指向该获取数据的 blob URI。鉴于此过程仅限于同源策略,为什么不直接将您的锚点指向要获取的资源?这里根本不需要 blob:// URI。 (另外,如果你真的很好奇,当你执行
fetch(url).then(r => r.blob())时,必须将整个数据作为 ReadableStream 获取,并存储在 ArrayBuffer 中。只有当整个请求完成时,ArrayBuffer 才会被复制到 Blob 中。 ) -
@Kaiido 首先,此方法确保浏览器下载 txt、pdf、mp4、HTML 等文件类型而不是打开它们。其次,这确保我们可以循环(或在本例中设置间隔)一组 downloadLinks 并创建 blob URL 的锚元素。事实证明,
http[s]://*类型的 URL 无法做到这一点,而blob://*类型的 URL 可以做到这一点。我在stackoverflow.com/questions/66666415/… 中讨论过这种行为 -
@Kaiido 我还注意到使用 fetch API 并不是做我想做的事情的最佳方式。正如您所指出的, fetch 首先将数据作为 ReadableStream 加载到内存中,然后才将其转换为 Blob 对象。因此,我现在正在使用 xhr 客户端。设置
xhr.responsetype = 'blob'可确保数据以 blob 形式获取/加载。
标签: javascript memory download fetch blob