【发布时间】:2019-01-07 00:00:47
【问题描述】:
我有一个程序记录页面加载过程中网站发出的每个GET/POST 请求。我想把这些请求一个一个地处理一遍,执行,然后判断返回的文件是不是Javascript。鉴于它不会有 .js 结尾(因为像这样的脚本,一分钟前从 google.com 拉出),我如何解析从请求中获取的文件并识别它是否是 Javascript 文件?
谢谢!
编辑:
得到假阳性比得到假阴性更好。也就是说,我宁愿将一些非JS 包含在JS 列表中,也不愿从列表中删除一些真正的JS。
【问题讨论】:
-
& 你尝试过什么?
-
检查内容类型
-
这很难,因为 javascript 内部没有特定的模式。如果您将扩展名更改为
js,则可以将包含'hey!';的文件视为javascript。基本上,它是一个带有js扩展名的纯文本文件。 -
我试图找到类似于
<!DOCTYPE html>的东西,但它似乎没有标准化。我还考虑过像解析 JS 一样解析所有代码,然后当抛出异常时(例如,无法正确读取来自 img 的二进制文件)将文件标记为不是 JS。这对我来说似乎有点危险,因为它可能在 JS 列表中有一些非 JS 代码,我需要避免。 -
@FastSnail 是否必须为所有 GET/POST 请求提供内容类型?
标签: javascript