不论是双层PDF文档格式,还是版式还原的单层PDF文档格式,都是经过加工的非结构化内容。目前,在各种阅读网站、频道上显示的电子书,绝大部分是经过这种类型加工的。文档打开速度是影响网站访问量的一个指标,和直接扫描修图的图像文件比较,PDF文档存储量要小些。