【发布时间】:2017-03-13 10:11:29
【问题描述】:
我热烈欢迎... 我有一个问题,我正在尝试将 PDF 转换为 txt,但无法保存 txt 文件??有人请帮帮我吗??
using System;
using System.Text;
using System.Windows.Forms;
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;
using System.IO;
namespace ZestawienieFaktur
{
public partial class Form1 : Form
{
public Form1()
{
InitializeComponent();
}
private void button1_Click(object sender, EventArgs e)
{
string[] filePaths = Directory.GetFiles(@"D:\\faktury\\", "*.pdf");
foreach (string fp in filePaths)
{
ExtractTextFromPdf(fp);
}
}
public static string ExtractTextFromPdf(string path)
{
using (PdfReader reader = new PdfReader(path))
{
StringBuilder text = new StringBuilder();
for (int i = 1; i <= reader.NumberOfPages; i++)
{
text.Append(PdfTextExtractor.GetTextFromPage(reader, i));
}
string lines = text.ToString();
using (var file = new StreamWriter(@"D:\faktury\test1.txt"))
{
file.WriteLine(lines);
file.Close();
}
}
}
}
}
在文件夹中,我有几个不同名称的 pdf 文件。 而且我要全部转换成txt的格式。 非常感谢您的回答...
【问题讨论】:
-
只要把“return text.ToString();”函数 ExtractTextFromPdf() 到函数末尾之间的行。
-
请编辑您的问题。在当前表单中,不清楚您使用的是哪个库
-
您在
ExtractTextFromPdf中间有一个return。假设不会到达下一行 -
@ArthurP.R.使用系统;使用 System.Text;使用 System.Windows.Forms;使用 iTextSharp.text.pdf;使用 iTextSharp.text.pdf.parser;使用 System.IO;
-
@Pikoh 下一行到底是哪一行?