【问题标题】:Java Program to read a html page and save its HTML code in a text file [closed]Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]
【发布时间】:2012-10-22 00:01:13
【问题描述】:

我正在开发一个项目,因为我有一个模块,我需要在其中编写一个 Java 程序来读取 html 页面并将其 HTML 代码保存在文本文件中。 请任何人都可以提供上述程序.......

【问题讨论】:

  • 除非您向我们展示一些我们不能(不应该)帮助您的代码。睡前阅读:What have you tried?

标签: java html stream


【解决方案1】:

看看http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html 你甚至不需要外部库。将此与 Bufferedwriter 结合使用:

import java.net.*;
import java.io.*;
import java.util.*;

public class URLReader {

    public static void main(String[] args) throws Exception {

        URL oracle = new URL("http://www.oracle.com/");
        BufferedReader in = new BufferedReader(
        new InputStreamReader(oracle.openStream()));
        BufferedWriter writer = new BufferedWriter(new FileWriter("outputfile.txt"));

        String inputLine;
        while ((inputLine = in.readLine()) != null){
            try{
                writer.write(inputLine);
            }
            catch(IOException e){
                e.printStackTrace();
                return;
            }
        }
        in.close();
        writer.close();
    }
}

【讨论】:

    【解决方案2】:

    您可以使用 HTMLParser 完成此任务,Read about it here

    【讨论】:

      猜你喜欢
      • 2014-02-18
      • 2015-01-23
      • 2017-05-11
      • 2015-02-24
      • 1970-01-01
      • 2018-05-09
      • 2014-04-06
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多