【发布时间】:2018-10-12 18:44:38
【问题描述】:
我正在使用 nokogiri 解析一个 html 文件并对其进行修改,然后将其输出到如下文件:
htext= File.open(inputOpts.html_file).read
h_doc = Nokogiri::HTML(htext)
File.open(outputfile, 'w+') do |file|
file.write(h_doc)
end
输出文件包含第一行:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
我不想要这个,因为我将 html 嵌入到不同的文件中,而这个标签会导致问题。
问题是如何从 h_doc 中删除它。
【问题讨论】: