【问题标题】:Read Webpage阅读网页
【发布时间】:2009-01-26 08:49:01
【问题描述】:

我想知道是否有人知道如何从 C++ 中读取网页中的文本。

在您首次使用常规方式连接到互联网后,

您输入字符串,例如“http://www.bbc.co.uk”和C++程序读取信息:

“BBC 网站这是 BBC 网站....”

来自互联网。

我是否必须编写一个程序来向调制解调器发送和从调制解调器发送大量数据才能做到这一点,还是有更简单的方法来做到这一点? Windows 中是否有某种命令行程序可以为您完成这一切?无论哪种方式,如果您对网络上的任何教程有任何提示,那就太好了。

我想知道,因为我认为编写可以从互联网上读取信息、跟踪链接等的应用程序会很有趣,我可能会想到一个利用这一点的好游戏。

谢谢。

保罗。

【问题讨论】:

  • 正如所指出的,已经在 SO 上问过好几次了,搜索一下...

标签: c++


【解决方案1】:

我会在 C/C++ 中推荐用于 http 的 lib cURL,但这仍然忽略了解析 html 以呈现来自标签的实际文本。

【讨论】:

    【解决方案2】:

    您可以使用 boost 轻松完成此操作。检查Asio

    Http Client Example(从互联网下载并显示 .txt 文件)

    【讨论】:

      【解决方案3】:

      您可以使用 wget 来获取页面,但您仍然需要解析输出。

      您不需要向调制解调器发送数据。您需要做的就是通过套接字连接到网络服务器并从那里检索数据。查找有关套接字编程和 http 协议的文献。

      【讨论】:

      • 投反对票是为了什么?我的回答有什么问题吗?
      • 你回答了一个重复的问题
      • 你一定是在开玩笑。如果问题是重复的,则要么对带有欺骗性链接的问题发表评论,并要求关闭问题或投票否决问题,而不是想要帮助的人的答案。如果我应该在......之前弄清楚一个问题是否是一个骗子......
      • ...我回答它,我永远不会回答任何问题。但是,提问者有责任检查之前是否有人问过这个问题。也许你不太明白 SO 应该如何工作......
      • 看起来你确实发布了指向骗子的链接,但在我回答后八分钟......去图......
      【解决方案4】:

      不是直接来自 C++,但有可用来源:有 Lynx 文本浏览器。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2011-10-27
        • 2010-12-02
        • 1970-01-01
        • 2012-12-10
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多