很多盲人朋友在读PDF文档时,会遇到读屏软件无法识别文字的情况——尤其是那些从纸质材料扫描而来的PDF,里面的文字其实只是一张图片,读屏软件根本"看不见"内容,只会报出一个文件名,或者沉默。

你可能试过专门的PDF阅读工具,也可能找人帮忙转换过格式,却依然效果不佳。

其实,有一个免费的、大多数人电脑上都已经安装好的工具,可以很好地解决这个问题——那就是微软 Word。


Word 读取 PDF 的原理

从 Word 2013 版本开始,微软在 Word 中内置了 PDF 转换功能。当你用 Word 打开一个 PDF 文件时,Word 会自动调用内置的 OCR(光学字符识别)技术,对 PDF 中的内容进行识别,并将其转换为可编辑的文字。

这意味着:

第一,即使是扫描版PDF,Word 也能从图片中识别出文字内容。

第二,转换完成后,文档中的文字是真正可被读屏软件朗读的文字,而不是图片。

第三,整个过程不需要联网,不需要第三方软件,在 Word 里直接完成。


具体操作步骤

操作步骤非常简单,共分三步。

第一步:找到你要阅读的PDF文件。比如它在你的桌面上,或者下载文件夹里。

第二步:用Word打开这个文件。有两种方式:

方式一,右键点击PDF文件,在弹出的菜单中选择"打开方式",然后选择"Word"。

方式二,先打开Word程序,点击"文件"菜单,选择"打开",然后找到你的PDF文件并打开。

第三步:Word会弹出一个提示框,告诉你即将把PDF转换为Word文档,转换过程可能需要一点时间。点击"确定"即可。

稍等片刻,文档内容就会出现在Word中,读屏软件可以正常朗读其中的文字了。


针对扫描版PDF,为什么 Word 特别好用

扫描版PDF是指用扫描仪把纸质文件扫描成图片后生成的PDF。这类文件对读屏软件非常不友好。

很多专业的PDF阅读工具对扫描版PDF的处理效果并不稳定,尤其是中文内容,识别错误率较高。而Word内置的OCR在处理中文扫描件时表现稳定,识别准确率较高,特别是对于格式规范的正式文件,如政策文件、通知公告、书籍章节等。

此外,Word的好处还有:

第一,识别后的文字可以直接用读屏软件逐字、逐句、逐段朗读,支持键盘快捷键操作,无障碍体验好。

第二,可以用Word自带的"查找"功能(快捷键Ctrl+F)快速定位关键词,不需要从头听到尾。

第三,可以选中某段文字,复制到其他地方使用,如发给朋友、存入笔记等。


需要注意的几点

第一,Word版本要求。此功能需要 Word 2013 及更高版本。如果你使用的是更旧的版本,可以考虑升级。目前常用的 Word 2016、Word 2019、Word 2021 以及 Microsoft 365 订阅版,均支持此功能。

第二,转换不是完美的。扫描质量越高,识别效果越好。如果原始扫描件模糊、歪斜或有污迹,识别出来的文字可能有错误。遇到关键内容时,建议请明眼志愿者帮忙核校。

第三,转换后的格式可能有变化。原PDF中的表格、图片、排版等,在Word中显示时可能与原样不同。但对于以文字内容为主的文档,这通常不影响阅读。

第四,原PDF文件不会被改动。Word打开PDF时,是复制了一份内容进行转换,原来的PDF文件本身不受任何影响。

总之,用Word打开PDF,是一个零成本、低门槛、操作简便的好方法,尤其适合盲人朋友处理那些读屏软件无法直接识别的扫描版PDF文档。