【发布时间】:2016-05-03 14:50:37
【问题描述】:
我正在尝试拆分组合的文本文件。合并后的文本文件里面有多个 xml 文件。我想拆分<?xml version='1.0'?>,这是组合文本文件中每个新 xml 的开始。不确定执行此操作的最佳方法是什么。目前这是我没有正确拆分的。
更新的代码工作(固定引号问题添加了 Pattern.quote):
Scanner scanner = new Scanner( new File("src/main/resources/Flume_Sample"), "UTF-8" );
String combinedText = scanner.useDelimiter("\\A").next();
scanner.close(); // Put this call in a finally block
String delimiter = "<?xml version=\"1.0\"?>";
String[] xmlFiles = combinedText.split("(?="+Pattern.quote(delimiter)+")");
for (int i = 0; i < xmlFiles.length; i++){
File file = new File("src/main/resources/output_"+i);
FileWriter writer = new FileWriter(file);
writer.write(xmlFiles[i]);
System.out.println(xmlFiles[i]);
writer.close();
}
【问题讨论】: