1.6.4 PDF文档加工
(1)PDF文档加工要求
PDF文档加工要求内容完整,无缺页、重页、页码顺序颠倒的情况;根据图书目录添加书签,书签内容从文本中复制,同时检查是否与纸质书一致,并删除多余空格,使得书签内容文字差错率小于三万分之一。并设置文档属性,使得打开PDF文件时,自动显示书签,且书签只展开到第一级目录;PDF初始放大率设置为“适合页面”,书签动作缩放比例设置为“承前缩放”。对PDF文档的加工一般有两种需求:第一种为双层PDF;第二种为版式还原的纯文本单层PDF。
(2)双层PDF文档加工
利用导入软件将中间文件的信息导入到专业排版工具中进行初步批量排版,批量排版可以把原书字体、字号、行距等信息批量处理并导出符合要求的PDF文件,导出的PDF文件中的文字及图像位置信息将与原书基本一致,至此将形成初步排版的版面文件。
添加书签,根据图书目录添加书签,书签内容从文本中复制,同时检查是否与纸质书一致,并删除多余空格,使得书签内容文字差错率小于三万分之一。并设置文档属性,使得打开PDF文件时,自动显示书签,且书签只展开到第一级目录;PDF初始放大率设置为“适合页面”,书签动作缩放比例设置为“承前缩放”。
终审,检查每个PDF数据的完整性,是否有缺、重页,页码顺序颠倒,页面尺寸大小是否一致,版心是否居中、一致,页眉线是否有锯齿现象,书签设置是否有误,内容字体是否嵌入,缺字是否矢量造字等。通过终检以上问题,确保每个PDF的综合差错率控制在三万分之一以内。
双层PDF图像层的要求与图像PDF相同,精度一般为300 dpi。图像层和文字层的文字对位准确,反显区域与文字区域相差控制在1毫米以内。图1-12表示的是PDF图像层与文字层错位,尚未对齐的情况。
图1-12 PDF图像层与文字层尚未对齐示例
在双层PDF文档加工时,TIF图在下面,中间文件调用的文字层呈透明状在上面,调整文字层以对准TIF图。在显示阅读时,上层看到的是TIF图,选中需要进行标注时的内容则是在文字层。双层PDF文档显示对准的情况如图1-13所示。
图1-13 PDF图像层与文字层对齐示例
在采用双层PDF文档进行阅读时,上层展现原图的图像文档,有两点需要说明:
①带有复杂公式、表格的单元不会在双层PDF时使用,不用再对公式、表格图像进行专门的切图处理。
②在双层PDF文档中,加工文字层统一为宋体。
(3)版式还原的纯文本单层(精排)PDF文档加工
单层PDF要求与双层PDF中的文字层大致相同,版式还原的纯文本单层PDF文档加工也叫做精排。排版人员使用专用排版工具进行人工精确排版。操作员根据原书图像通过改变正文、页眉页脚字体、字号、类型,标注上下标,换页眉线等一系列操作完成精确排版工作,排版的文件版式与原书内容保持一致。最后导出符合合同要求、符合国际标准的PDF文件。
有两点需要说明:
①要求版式与原纸质图书保持一致。部分没有或者难以辨别的字体可用相似字体代替。图1-14展示的是版式还原的纯文本单层PDF文档,它在图书的原有版式中,将文字内容以纯文本方式展现。
图1-14 版式还原的纯文本单层PDF示例
②生僻字造字问题。由于文字本身是矢量,不使用图片,因此碰到生僻字时,要求用矢量造字补缺。在补字对应的文本处统一用“■”表示。就是说,需要另行造字,再替补黑方块所代表的字。图1-15表示了生僻字的造字显示。
图1-15 生僻字的造字显示
将形成矢量的生僻字植入纯文本单层PDF文档中的情况如图1-16所示。
图1-16 植入单层PDF中新造的矢量字
(4)加工成品检查
检查每个PDF数据的完整性:①是否有缺、重页,页码顺序颠倒;②页面尺寸大小是否一致,版心是否居中、一致;③页眉线是否有锯齿现象;④书签设置是否有误;⑤内容字体是否嵌入;⑥缺字是否矢量造字等。通过终检以上问题,确保每个PDF的综合差错率控制在三万分之一以内。