【发布时间】:2019-07-26 06:10:20
【问题描述】:
我有以下 HTML,我应该怎么做才能从变量中提取 JSON:window.__INITIAL_STATE__
<!DOCTYPE doctype html>
<html lang="en">
<script>
window.sessConf = "-2912474957111138742";
/* <sl:translate_json> */
window.__INITIAL_STATE__ = { /* Target JSON here with 12 million characters */};
/* </sl:translate_json> */
</script>
</html>
【问题讨论】:
-
到目前为止你有什么尝试?
-
1200万个字符的json都在一行吗?这将大大简化答案。
-
@JeffUK 我尝试从脚本标签中获取所有文本,然后拆分('\n'),但它以某种方式将 JSON 分解为几个子字符串。
-
@solarc 是的,它是单行 JSON。
-
你的系统中有
nodejs吗?
标签: python html json beautifulsoup