【发布时间】:2012-10-22 00:01:13
【问题描述】:
我正在开发一个项目,因为我有一个模块,我需要在其中编写一个 Java 程序来读取 html 页面并将其 HTML 代码保存在文本文件中。 请任何人都可以提供上述程序.......
【问题讨论】:
-
除非您向我们展示一些我们不能(不应该)帮助您的代码。睡前阅读:What have you tried?
我正在开发一个项目,因为我有一个模块,我需要在其中编写一个 Java 程序来读取 html 页面并将其 HTML 代码保存在文本文件中。 请任何人都可以提供上述程序.......
【问题讨论】:
看看http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html 你甚至不需要外部库。将此与 Bufferedwriter 结合使用:
import java.net.*;
import java.io.*;
import java.util.*;
public class URLReader {
public static void main(String[] args) throws Exception {
URL oracle = new URL("http://www.oracle.com/");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));
BufferedWriter writer = new BufferedWriter(new FileWriter("outputfile.txt"));
String inputLine;
while ((inputLine = in.readLine()) != null){
try{
writer.write(inputLine);
}
catch(IOException e){
e.printStackTrace();
return;
}
}
in.close();
writer.close();
}
}
【讨论】:
您可以使用 HTMLParser 完成此任务,Read about it here
【讨论】: