一、纸质文献历史3阶段
在20世纪以前的四千年里,文献的载体先后经历了甲骨、青铜、简帛、纸4个发展时期,其中尤以纸对文化传承发展最为关键。而以印刷技术的出现及变革为界,纸质文献载体的历史又可以划分为3个阶段。
从西汉宣帝到唐末的九百年为第一阶段,这一时期纸质文献的传播主要靠写本和抄本流传,因此书籍的数量不多,一旦有限的几个抄本丢失,该书就亡佚。如《汉书·艺文志》所载614种古书,完存者仅42种。
从五代到清末这九百年为第二阶段,这一时期出现了雕版印刷和活字印刷,批量刻印使得书籍复本大大增加,成本降低使得越来越多的普通人可以买到书,由此出现了宋元明清的文化鼎盛时代。即便如此,古籍文献的亡佚仍触目惊心。仅就宋元两代来说,四百年间所有官刻、私刻、坊刻之书数以百万计,但今天全球所有宋元版汉籍仅存5 000部左右,其中,中国大陆3 500部,日本720余部,台湾712部,美国约125部[5]。正是因为宋元版书亡佚严重,存世稀少,坊间才有“一页宋版,一两黄金”之说。
从清末到现在的一百多年为第三阶段,这一时期印刷技术突飞猛进,印刷效率、印刷质量都发生了质的改变,各种公私藏书数以亿计,看起来似乎不会再出现古代的“书厄”,然而这是一种盲目的乐观。事实上,“纸寿千年”仅仅是指古籍,现代工艺制造的纸张,寿命远比不上古代的纸张。因为古代造纸工艺以手工为主,材料多用植物的韧皮纤维,造出来的纸张一般呈中性或偏碱性,能够保存上千年。而近现代文献用纸多为机械磨木浆纸和酸性化学浆纸,酸性较强,保存时间很短。据了解,民国报纸的寿命为50~100年,民国图书的寿命为100~200年。现在国家图书馆所藏民国文献67万册(件),中度以上破损的占90%以上。
二、古籍数字化
传统文献载体由于其脆弱的属性,不可避免地会损坏亡佚,但随着科技的发展,新一代文献载体出现——电子媒介。针对古籍领域,这场变革可以称之为“古籍数字化”。古籍数字化即“从利用和保护古籍的目的出发, 采用计算机技术, 将常见的语言文字或图形符号转化为能被计算机识别的数字记号,从而制成古籍文献书目数据库和古籍全文数据库, 用以揭示古籍文献信息资源的一项系统工作。”早在1972年,台湾清华大学图书馆就已经开始用计算机为图书编目,这其实就是中文古籍数字化的肇始。1998年,上海人民出版社、北京书同文电脑技术开发有限公司与香港迪志文化出版有限公司联合推出的《文渊阁四库全书》电子版,是古籍数字化进程中标志性的产品,再到近几年刚刚上线的中华书局“中华经典古籍库”,以及国家图书馆新推出的“中华古籍资源库”,中文古籍数字化已走过了40多个年头。
据不完全统计,我国目前现藏古籍至少在5 000 万册以上,历经岁月的侵蚀,其中三分之一损毁和自然老化非常严重,亟待保护。以中国国家图书馆为例,其约有150万册(件)珍贵古籍存在不同程度的破损,仅古籍善本中,轻度破损的就有13万册(件),中度破损的有26万册(件),重度破损的有12万册(件)。地方图书馆、博物馆、档案馆由于条件简陋,破损程度更为严重。试想以现在的古籍破损速度,百年之后大量古籍将无法阅读,而古籍文献乃中华文化最重要的物质载体,皮之不存,毛将焉附。
为了解决古籍损坏的问题,目前有两种办法:一是加快古籍修复,但目前古籍修复人才缺口很大,修复的速度远远赶不上损坏的速度;二是进行古籍数字化,将尚可辨识的古籍扫描成图像,做成古籍数据库。这样即使古籍的物质实体损坏了,古籍的内容将永远保存。