PDF协会吐槽穆勒的“通俄门”报告看着很糟糕

昨日,特别顾问罗伯特·穆勒(Robert Mueller)发布了有关“俄罗斯干预 2016 美总统大选”的报告,引发了无数人的下载围观。然而他们很快就沮丧地发现,你根本无法搜索页面上的任何文字,且整个文件的体积相当庞大。

在普通人发表吐槽的同时,PDF 协会(PDFA)也实在是坐不住了。其给出了一份长篇幅的解释,说明“为何穆勒的 PDF 报告文件做得如此糟糕”。

PDF协会吐槽穆勒的“通俄门”报告看着很糟糕

报告截图(来自:PDAF,viaTheVerge)

该协会指出,穆勒的这份报告,既是司法部的一个回应,也是对 PDF 这种便携式文件格式的认同。

PDF 协会指出了一些基本的事实,比如 448 页的文档质量‘勉强可以接受’,但不符合严格的档案标准。

PDFA 猜测,这份 4 月 17 日出炉的报告,或许是在办公室里某台典型的网络复印 / 打印机上制作的。尴尬的是,它没有采用文本格式,而是选择了更适合照片的有损压缩方式。

司法部应该是从穆勒那里拿到了高品质的 PDF,然后打印出来又重新扫描。或者穆勒只提供了纸质的报告,因此司法部只能扫描后再发布。

对于此类文档,PDF 是唯一符合“文化与技术要求”的格式。正如帖子中指出的那样,重新扫描可以确保文件中不包含不适当的文本数据,但也限制了人们可以看到的文字和编辑框。

然而经过来回倒腾,不仅文件体积特别膨胀,还造成了信息检索上的大麻烦 —— 除非你愿意重新运行以便 OCR 识别纠错(而且这个过程不如扫描原始源文件那么准确)。

PDF协会吐槽穆勒的“通俄门”报告看着很糟糕

(PDAF 同时希望大家能关注今年 6 月在西雅图举办的电子文档大会)

即便如此,对可搜索性造成严重破坏的 PDF 文件,偶尔也会暴露一些令人尴尬的秘密。比如在 Facebook 诉讼庭审文件中,就有一些匆忙绘制留下的黑条(隐藏了某些可选的文字)。

当然,专业的编辑软件,可以避免发生这样的事情。PDF 协会指出,未标记和无法检索的 PDF,可能违反了司法部对于残疾人的无障碍规则。

那么除了 PDF,为何正式文件不采用 WORD、TIFF 图像、网站、XPS、EPUB、或者纯文本的格式呢?该协会给出了简短的回答:

PDF 保留了文档的原始文本和格式,可以包含明确的编辑,并且受到多平台的支持,这是唯一能够满足现代重要通信文化和技术要求的文件格式。

最后,就司法部对于如此重要的文件格式的不尊重,PDF 协会表达的强烈的不满。一位专家表示:这份报告文件让人看了既羞愧又难过。


分享到:


相關文章: