【问题标题】:Problems with saving content of web page in html在html中保存网页内容的问题
【发布时间】:2020-08-13 22:08:59
【问题描述】:

我在推特上请求查找特定时期的推文。之后我开始向下滚动页面到最后一个推特。接下来我正在保存此页面的 html 代码(右键单击 -> 另存为...)。此 html 文件中仅显示最新的推文。如何将所有推文保存为html格式?

【问题讨论】:

    标签: html twitter


    【解决方案1】:

    Twitter 可能会动态地从其 html 代码中添加/删除。很可能它使用无限滚动和看似无穷无尽的页面。使用浏览器时,您只能看到所有推文的“快照”,并且永远无法保存所有推文。我可以通过使用浏览器的检查器然后滚动来证明或检查这一点。我从未尝试过,但在代码检查器中,您可以看到添加/删除或隐藏的内容。 Javascript 负责你所看到的以及你可以保存的内容。

    使用 Firefox Ctrl+Shift+C,我发现 HTML 代码标记为 'aria-label="Timeline: Your Home Timeline" '。在它下面,您可以找到可见的推文。当您滚动时,您只会看到可以保存在文件中的那些。这里只有 11 条推文。当您滚动时,会添加和删除一个数字,但只有一个减少的数字可用。

    查看所有推文的唯一方法是当 Twitter 允许您访问他们的推文数据库时,可能是通过程序员界面,但仍然会有太多无法保存所有推文。

    【讨论】:

    • 感谢您的回答
    • 当你认为它是正确答案时,你能把它标记为正确答案吗?谢谢!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-10-04
    • 1970-01-01
    • 2023-04-07
    • 2010-11-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多