中国人民大学信息资源管理学院
电子文件管理百科  > 所属分类  >  名词术语   
[3] 评论[0] 编辑

版式文件

目录

英文 编辑本段


Paginated Document/ P-shaped Electronic Document


 

定义 编辑本段


1、安徽省档案馆《版式电子文件存档格式需求》:版式电子文件(P-shaped Electronic Document)是在不同设备和阅读软件上具有显示一致性的版面固定的电子文档
2、版式文件 (Paginated Document) 又叫版面固定文档,特点在于在不同设备和阅读软件上具有显示结果的一致性。它在自定义的坐标系中,明确地指定了每个文档内容显示的位置,尺寸等。版式文件还可以进行字体嵌入,保证了真实的重现文档的原貌。由于版式文件的这种“稳定”性,非常适合于作为电子文档的最终发布形式。但是由于版式文档对布局信息的绝对描述,使得它不利于编辑,每次修改文档内容后需要对布局重新计算,重写整个文档的布局信息。因此版式文档适合作“只读”的电子文档格式。

3. 版式文档的特点是版面固定、不跑版,即所见即所得(What you see is what you get,),使电子文档在使用过程中,呈现效果不因软硬件环境、操作者的变化而变化,在版式、版面、字体、字号等方面与纸质文件保持完全一致。版式文档格式的特点使它成为电子文档发布、数字化信息传播和存档的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用版式文档,在国外,Adobe公司的PDF版式文档格式目前已成为数字化信息事实上的一个工业标准。版式软件是指用于操作版式文档的系列软件。

 

版式文件的类型 编辑本段


目前主要的版式文件格式有Adobe公司推出的PDF (Portable Document Format),微软公司推出的XPS (XML Paper Specification),和北京大学计算机研究所推出的CEB (Chinese E-paper Basic)。


1、PDF:

图1 PDF文件中的内容描述图1: PDF文件中的内容描述

PDF的文件结构包括四个部分:文件头、文件体、交叉引用表和文件尾。文件头指明了该文件所遵从PDF规范的版本号,它出现在 PDF 文件的第一行。如%PDF-1.2表示该文件格式符合PDF1.2 规范。文件体由一系列的 PDF 间接对象 (Indirect Object) 组成。这些间接对象构成了PDF 文件的具体内容如字体、页面、图像等等。交叉引用表则是为了能对间接对象进行随机访问而设立的一个间接对象地址索引表。文件尾声明了交叉引用表的地址,指明文件体的根对象(Catalog),还保存了加密等安全信息。根据文件尾提供的信息,PDF的应用程序可以找到交叉引用表和整个PDF文件的根对象,从而控制整个PDF文件。
PDF中的页面内容都保存在页面对象的Contents关键字对应的对象中。该对象的内容称为内容指令流,其中采用描述指令来描述文档的显示内容。页面描述指令描述了页面上的一系列图形对象,这些图形对象可分为四类:路径对象(Path Object),文本对象(Text Object),图像对象(Image Object),外部对象(Resource) 。


2、XPS:

XPS是XML Paper Specification的简称,它是微软公司开发的一种文档保存与查看的规范。最为显著的特点是,XPS采用 XML 语言而不是内容指令流来对内容进行描述。XPS所用的置标语言是WPF所用的XAML的一个子集,因此显示 Windows 应用程序所用的方法可以用于 XPS 文档。XPS文件实际上是一个包含组成文档的各个文件的ZIP文档。这些文件包括每页XML描述文件、嵌入的图像与字体以及数字版权管理信息。


3、CEB:

CEB是北京大学计算机研究所拥有自主知识产权的一种版式文件格式, 目前在我国电子出版和政府机关电子公文处理中应用广泛,常用的电子文档,如 WORD、WPS等,都可以方便地转换成CEB格式。同PDF文件格式类似,CEB通过页面描述指令来描述内容。

表1:版式文件类型表表1:版式文件类型表



 

版式文件存档格式应具有的特征 编辑本段


这是安徽省档案局在《版式电子文件存档格式需求》中提出来的几个特征:


1、格式透明:格式代码开放,有公开发表并免费使用的相应标准和技术规范。不应设置技术壁垒,妨碍对格式的理解。有与产品无关的专家组、标准化组织和产业联盟等维护和支持该格式。
2、不绑定软硬件:被多种操作系统和硬件平台支持。文件的阅读不依赖于特定的阅读器。文件中引用的资源和运用的算法不应是知识产权保护对象。使用与设备无关的颜色规范实现准确打印和再现。
3、文件自包含:文件呈现的全部信息百分百自包含。文件中必须包括全部字体的字形描述信息或嵌入字体程序信息。文件中还应包括光栅图像、矢量图形、颜色信息等其他需要显示的信息。文件的显现不依赖于非嵌入的外部对象。
4、格式自描述:应声明文件格式遵循的标准和版本。文件格式清晰,易于解读。设置规范的元数据集(可以与相关国际、国内标准映射),并以文本方式(通常为XML)内嵌于文件中,用于描述文件和对象的属性特征(通常包括内容表征信息和保存描述信息),并易于提取和检索。文件中允许封装用户自定义的元数据信息。文件中的字符对象应声明编码标准。
5、显示一致性:固定显示文件页面、章节、段落、字体等,不因软硬件平台和阅读器变化而变化。以自然阅读顺序提供文本,以便阅读。禁止可选内容(在某些条件下满足时可显示或打印)。禁止调用一致性阅读器之外的程序播放文件内的多媒体对象。禁止运行交互式表单和内部可执行代码。
6、持续可解释:允许用户对文件和文件中的对象添加注释。不允许设置口令保护。不包含加密协议,不包含加密选项。
7、稳健:文件格式稳定,版本升级更新有序,并前后兼容。文件不因单点故障而解析失效。
支持无损压缩。在压缩协议中不使用分辨率的缩减取样。
8、可转换:支持其它格式转换为版式电子文件存档格式。支持过时的版式电子文件存档格式转换为新的版式电子文件存档格式。
9、利于存储:格式紧凑,数据结构合理,数据占用字节数少。支持在一个文件中容纳大量对象和数据。具有聚合能力,可以把几个相关的存档格式文件聚合到一个文件中。
10、支持技术认证机制:支持数字水印、数字签名、循环冗余校验或纠错码,并便于验证。


附件列表


3

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 档案联    下一篇 密级

标签

暂无标签

参考资料

[1].  曲径.一种版式文件中结构信息表示方法的设计与实现 [D].北京:北京大学,2007:4-5.   http://thesis.lib.pku.edu.cn/dlib/download.asp?lang=gb&DocID=214111&fmt=1&url=HTTP%3A%2F%2F162%2E105%2E138%2E175%2Fxwlwdownload2007%2F00214111%5F00272703%2ECEB
[2].  安徽省档案局.电子文件长期保存格式需求[EB/OL].   http://www.ahda.gov.cn/DocHtml/1/2009/8/11/714970174613.html
[3].  安徽省档案局.版式电子文件存档格式需求[EB/OL].   http://www.ahda.gov.cn/DocHtml/1/2009/8/11/506834194612.html
[4].  百度百科.版式文档   https://baike.baidu.com/item/%E7%89%88%E5%BC%8F%E6%96%87%E6%A1%A3/6845753?fr=aladdin

同义词

暂无同义词