PDF Plain Text Extractor

PDF Plain Text Extractor是一款易用使用的pdf文字提取工具,该程序旨在帮助您从PDF文档或PDF页面中提取文字内容,并将其输出为txt,当您需要以纯文本阅读,或者将文本内容导入到其他位置,此软件非常有用。其具备了简单直观的作界面,从内置的资源浏览器中选择要转换的PDF文件,随后在设置窗口下配置页面范围、PDF输出等基本参数,即可执行转换任务。总的来说,PDF Plain Text Extractor带来了一套简单的PDF转TXT方案,任何用户都能轻松使用。

PDF Plain Text Extractor软件功能

1. 它直接分析原始pdf文件,并从中提取纯文本,同时保留pdf文件的版面。

2.不需要任何第三方产品(例如Adobe Acbat或Adobe Acbat Reader)。

3.支持LZW编码的pdf文档。

4.支持英语,法语,德语,意大利语和其他语言。

5.您可以拖放pdf文档以完成转换。

6.可以转换整个文件夹(递归与否)。

7.一次可以转换来自硬盘驱动器不同位置的pdf文件。

8.可以保存转换的pdf文件列表以备将来使用。

9.可以输出文件的页面范围。

10.可以将分页符字符串设置为单独的页面。

11.可以用分页符字符串设置输出页码。

12.可以通过图形用户界面浏览pdf文件的(标题/作者/创建期…)。

13.可以选择将pdf文件的输出到输出文本文件。

14.可以设置单个pdf文件或转换列表中所有pdf文件的输出文件夹。

15.支持unicode,多字节语言。

16.支持Type0,Type1,Type3,TrueType,CIDFont字体。

PDF Plain Text Extractor软件特色

PDF Plain Text Extractor是一款可以帮助您将“便携式文档格式”文件中的文本保存到单独文档中的软件。

该程序的用户界面简洁明了,易于浏览。因此,您可以使用文件树视图或“拖放”方法将文件添加到列表中(支持批量转换)。

您可以查看文件夹中包含的每个PDF文件的名称,大小和修改期,以及其标题,主题,作者,创建者,生产者,创建期和关键字。

您可以指定输出目标,预览PDF(如果安装了兼容程序),启用输出过程详细和输出过程时间,以及设置页面范围,分隔符和编号。

此外,您可以启用PDF纯文本提取器来覆盖现有文件,并将输出与源文件放置在同一文件夹中,保存转换列表,从列表中删除文件,等等。

该程序使用非常少的系统资源,并包含一个全面的帮助文件(带有快照)。在我们的测试过程中,它没有冻结或崩溃,并且设法提取了除英语以外的其他语言中的特殊字符。

另一方面,当尝试从带有图像或表格的PDF文件中提取文本时,该软件遇到较小的格式设置问题。

总而言之,即使是菜鸟,也可以轻松使用PDF Plain Text Extractor。强烈建议您使用该程序将PDF转换为文本。

PDF Plain Text Extractor安装方法

1、双击安装程序进入如下的许可协议窗口,点击【I agree】。

2、选择安装位置,用户可以选择默认的C:Pgram Files (x86)Retsina SoftwarePDF Plain Text Extractor。

3、弹出如下的安装成功窗口,是否打开帮助文档,可以点击【是】或【否】。

PDF Plain Text Extractor使用说明

将文件夹添加到转换列表

启动PDF纯文本提取器后,您将在下面看到图形用户界面。

左上面板是计算机的驱动器/文件夹列表。 您可以浏览此列表以找到要转换为文本文件的pdf文件。 您可以右键单击该文件夹,将文件夹中的所有pdf文件导入到转换列表中。

将会弹出一个窗口

如果选择是,则此文件夹及其子文件夹中的所有pdf文件都将导入到转换列表中。 如果选择“否”,则仅会添加当前文件夹中的pdf文件。

您也可以将文件夹拖放到右上角的面板中,以将文件夹添加到转换列表中。

获取当前pdf文件的

每个pdf文件都包含有关谁/何时/通过什么工具创建了pdf文件的。 pdf文件的标题是什么…等等。 将pdf文件添加到转换列表之后。 您可以通过在列表中突出显示pdf文件来获取pdf文件的。 相应的将显示在右下方的面板中。

将PDF文件转换为文本文件

将pdf文件导入转换列表后。您可以将其中的一些或全部转换为文本文件。在右上角面板上单击鼠标右键,将弹出菜单。

菜单中有6个项目

1.转换选定的文件

将右上方面板中的选定pdf文件转换为文本文件

2.删除选定的文件

从转换列表中删除选择的pdf文件。(PDF纯文本提取器永远不会从您的系统中删除pdf文件)

3.全部转换

将转换列表中的所有pdf文件转换为文本文件。

4.全部删除

从转换列表中删除所有pdf文件。此命令将清空转换列表。

5.设置输出文件夹

为某些pdf文件或所有pdf文件设置文本文件的输出文件夹。

6.打开PDF

使用关联的应用程序打开选定的pdf文件。

选择“转换所选的pdf文件/全部转换”后,将弹出一个配置窗口。

您可以设置PDF纯文本提取器的输出选项,请参阅“配置PDF纯文本提取器”中有关配置的详细。

完成配置后,按“下一步>”,将弹出另一个配置窗口。您可以设置文本文件输出文件夹和“覆盖”选项。

有两个复选框。

1.与PDF文件的文件夹相同

如果选中此复选框,则文本文件将输出到pdf文件的同一文件夹中。

名称将从balabala.pdf更改为balabala.txt。

如果要将文本文件输出到其他文件夹,则需要取消选中此框,单击“浏览”以选择特定的文件夹。

2.覆盖现有文件

默认情况下,始终不选中此复选框。如果要覆盖输出文件夹中的文本文件,则需要选中此框。

完成所有配置后,按“完成”。处理窗口将弹出。所有详细处理都显示在此窗口中。您可以随时按“取消”取消转换。

转换后,相应的文本文件条目将添加到右上方的面板中。您可以右键单击文本文件以将其打开或删除。

上一篇 2022-11-28

相关推荐

  • PDF Plain Text Extractor

    PDF Plain Text Extractor是一款易用使用的pdf文字提取工具,该程序旨在帮助您从PDF文档或PDF页面中提取文字内容,并将其输出为txt,当您需要以纯文本...
正在提交中,请稍等片刻...

发表回复

请登录后评论...
登录后才能评论

评论列表 (0条)