SGML/XML在电子出版中的应用
文章摘要:随着网上期刊数量的不断增多,网上出版过程(稿件编辑、排版及文件、图像传输格式)的复杂性和读者对网络期刊的高要求,出版者急需一个有效的途径去组织和管理这些信息。作为描述文献信息结构和文本内容的SGML(Standard Generalized Markup Language)正好适应了这一要求,成为期刊网络出版中的支持技术和标准。
文章主题:SGML XML 电子出版 计算机语言 排版软件 网络出版
文章内容:在电子出版中的应用随着网上期刊数量的不断增多,网上出版过程(稿件编辑,排版及文件,图像传输格式)的复杂性和读者对网络期刊的高要求,出版者急需一个有效的途径去组织和管理这些信息.作为描述文献信息结构和文本内容的()正好适应了这一要求,成为期刊网络出版中的支持技术和标准.,标准通用标记),是(,国际标准化组织)1986年颁布采用的文献信息生产,管理的国际标准,8879.是一种电子文献的格式或描述文献的一种计算机语言.它从两个层次——结构和内容来反映一篇文献,其核心是文献类型定义().可以把来源不同的原始资料(如片段,字处理文件,数据库查询结果,图形文件,视频文件等各方面的资料)组装在同一个文件中,可以自由地定义文件结构,给一个文件添加新的标记,以反映文件结构单元,并校验电子文件是否遵循在中所定义的结构.这种标记不依赖于任何软件和硬件.是一个庞大复杂的系统.它的应用标准包括超媒体文献标记方面的超媒体语言(/-1,文献式样语义和规格语言(),(),可扩展的式样语言[可扩展的链接语言()等.超文本标记语言()是中非常成功的一个应用子集,但它丧失了的许多强大功能:不允许用户自行定义他们自己的标识(或属性)来更好地从语义上修饰数据;的标签集小,只支持有限的结构,最多只有6层,不能满足某些文献结构描述的要求,尤其是学刘雪梅方曙田术电子文献.的规范文件,不能对文件进行结构检验.可扩展标记语言()对稍作修改,引进了—来定义:中结构的组织规则,如应用到哪些数据元素,这些数据元素之间有什么样的结构关系,当接收到文件应用程序没有这个文件的描述时,可以帮助应用程序对进行校验.虽然是的一个子集,但既省去了的复杂性,又在信息处理上具有极大的表现力和灵活性,同时弥补了的标签集小,不能进行结构检验等不足之处.有人这样形象地描述,和的关系:是之父,是之兄.用可大大减少学术期刊网上出版的成本.强大的结构描述能力和灵活性,解放了从一个系统到另一个系统所需的繁重而高成本过程.它不需要任何软件."你可以用铅笔写一个文件,把它放在杂货袋里,然后将它埋在院子里的一个盒子里.几个世纪后,仍能够把它挖出来并翻译,只要他们用''说话".它适应于任何形式的展示,如印刷型或电子版,包括已存在或尚未发明的.如果出版营是用标记文献的话,他们将要重复标记已出版的文献以适应技术的发展.因此,随着的发展,已有被取代的趋势.则提出供了一种能满足技术发展而又使成本最小化的途径.能使文中图表多次链接,以满足印刷型和电子型的共同要求,传统的排版软件图表初次被引用时只有一个编码,但在网络出版中被期望有多次链接,丰富的标记在此显示出具大的作用.具有强大的媒体功能,可以组织,管理已经印刷出版的或未经印刷出版的不同方式的信息,许多贮存器被称为"文本数据库".从网络出版的标记过程来看,在编辑标记,排版标记,服务器标记中都能显示出其优势,但在出版标记中,由于没有主流浏览器支持,不支持样式,如和都不支持.—的与一起就能出色地完成在服务器上发布网页./是描述文本内容和结构的好方式,而则是贮存页面虚拟面貌的电子描述.它具有很强的独立性,可以作为独立的网页在网上发布,如美国的《科学》杂志的电子版就是采用在因特网上发行的.对一般的学术期刊网络出版商而言,/和都是必需的.在使用和12083的过程中可以肯定,这些标准在学术期刊网络出版中具有很大的优势,但同时表现出许多不足.首先,只允许一个,且必须用浏览器阅读的那套规则不能满足学术期刊文献结构的复杂度,可以解决这个问题,但允许无限制的,它仍旧需要复杂的软件才能阅读./和12083的另一缺点是.难以保证文献的忠实性.尽管/中的具有校验功能,但这种校验功能不能代替校对.因为这种校验只能证明标记是否合法,这种合法性对的许可程度有很大的依赖性.例如,一个段落的标记在一段内只用一次,多余的&;&;标记号就会被发现.然而合法的作者标记&;2&;被标为&;1&;的话,检验仍会判断其为正确.这就为编辑标记自动,准确地转换成排版标记设下了障碍.美国加利福尼亚大学出版$4-正在研究如何解决这个难题.也为此给出了许多修订的规则,但过多的扩展修订,使这个标准的修订价值有所丧失.修订12083使之适应更大范围的出版要求的工作正在进行.12083为学术期刊电子出版的缺点是用一套元素来定义文献.一篇文献包含段落,段落包含部分和亚部分,部分和亚部分又各自包含段落,这些段落又包含亚元素如整段的引用~因此,一个元素的定义不仅依赖于标记,而且依赖于其本身的内容.如&;&;标对普通的文本段落和引用的段落而言,格式是不一样的.由于这些成套的元素,只有高水平的排版软件才能阅读2083标记的文件,而这些文件的使用又需要高技能的操作者~由此可见,的复杂性,灵活性是它的优点,也足它的缺点.学术期刊结构复杂,使用率高,最适于用.但要编写一个来满足不同出版者的要求几乎是不可能的,建立一套完全满足印刷型和电子版要求的文件,编写结构和内容都很好的文件.建立良好的以为基础的工作流程是一项艰苦的工作.整个标准及技术研究很热.的灵活性和复杂性为电子期刊制作提供了很有前景的途径一使信息具有可重复性,长久性,有效性,共享性,信息的增值和高效性,使电子期刊在网络环境下处于开放的系统环境中.电子期刊的发展尚未成型,但其发展方向和趋势是明确的一一电子服务器.整个出版过程对的依赖性将会愈来愈强,加强相关技术的研究是迫切和艰苦的.然而标准贵在统一.
153066-32-70238M-200102-24771616-d9592823