探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③)

发布时间:2024-11-16 15:45:28 来源: sp20241116

  图①:读者古籍数字科技中心工作人员对文溯阁《四库全书》数字化文件进行质检。   本报记者 王锦涛摄   图②:甘肃省图书馆依托文溯阁《四库全书》开发的文创产品。   图③:甘肃省图书馆文溯阁《四库全书》藏书馆工作人员巡查书库。   图②③均为甘肃省图书馆提供   图④:甘肃省图书馆文溯阁《四库全书》藏书馆主楼。   本报记者 王锦涛摄

  引 子

  登临兰州北山九州台,甘肃省图书馆文溯阁《四库全书》藏书馆跃入眼帘——馆楼飞檐翘角,踞北山而瞰黄河。

  自正门入楼,穿鞋套,做登记,进书库。书库恒温恒湿,1128个香樟木书箱层层叠叠,收录典籍6141函、3474种、36315册的文溯阁《四库全书》就安放于箱中。

  2023年6月,习近平总书记在中国国家版本馆中央总馆考察调研时,详细听取《四库全书》版本源流、纸张印刷、保护收藏等介绍,叮嘱工作人员:“我最关心的就是中华文明历经沧桑留下的最宝贵的东西。中华民族的一些典籍在岁月侵蚀中已经失去了不少,留下来的这些瑰宝一定要千方百计呵护好、珍惜好,把我们这个世界上唯一没有中断的文明继续传承下去。”

  《四库全书》编纂于清代乾隆年间,是我国历史上规模最大的丛书,修成后誊抄7部,分藏于紫禁城文渊阁、圆明园文源阁、盛京(今沈阳)文溯阁、承德避暑山庄文津阁、杭州文澜阁等地。目前存世三部半,分别为文渊阁本、文溯阁本、文津阁本,以及被称为“半部”的文澜阁残本。其中,文溯阁本辗转多地,于2006年入藏现在的藏书馆,也是“三部半”中唯一尚未完整影印出版的一部。

  为了让书写在古籍里的文字活起来,经过长期缜密的筹划论证,2021年8月,甘肃省正式启动文溯阁《四库全书》数字化影印出版工程。

  目前,文溯阁《四库全书》数字采集工作已全部完成,数据处理工作完成70%。从现在起至2028年,文溯阁《四库全书》将按经、史、子、集四部,分期分批推出全套影印版本。

  

  数字采集

  采集方案、流程规范和相关作业标准周密完善

  约8亿字的文溯阁《四库全书》共有多少页?数字化之前鲜有人知。

  “换算为现代书籍页码,共488万多页。”文溯阁《四库全书》数字化影印出版专职工作组组长宋学娟说。

  作为读者出版集团有限公司所属的读者古籍数字科技中心总经理,宋学娟过去两年多时间带领团队把文溯阁《四库全书》从纸上“搬进”了电脑——逐页扫描、存入,数据资源总量逾700TB(太字节)。“如果用常见的容量32GB的U盘存储,需要2.2万多个才能装下。”宋学娟说。

  文溯阁《四库全书》既是历史典籍,又是珍贵文物。若藏于高阁,难以活化利用;若活化利用,又有损坏之虞。如何破解“藏”“用”两难?2021年8月,甘肃省委宣传部制定《文溯阁〈四库全书〉数字化影印出版工作重启方案》,力求在保护的同时“唤醒”古籍。

  古籍真本由甘肃省图书馆提供,数据采集处理、影印出版等工作由读者出版集团有限公司具体实施。数字化影印出版工程分为“数字采集—数据处理—影印出版及数据库建设”3个阶段。所需经费,部分由中央文化产业发展专项资金、甘肃省财政资助,部分由读者出版集团有限公司自筹。

  数字采集,免不了要接触古籍真本,如何确保其安全无损?甘肃省图书馆和读者出版集团有限公司制定了周密完善的采集方案、流程规范和相关作业标准,“54条数字化工作流程规定,涵盖前期准备、文献出库、数据处理等全部流程。”宋学娟介绍。

  为保古籍安全万无一失,文溯阁《四库全书》藏书馆二楼会议室被改造成了数字采集室,做到原书“出库不出馆”。而从书库到采集室,平常不到一分钟的路程,藏书馆90后馆员魏乔波却要走好几分钟:戴上白色手套,细查一遍即将出库的古籍,再轻轻捧起,就像捧着一碗不能洒出的水,慢慢往楼上“移”,“就怕脚下不稳”。

  “古籍出库,要填报11类表格,层层审批。归还时,所有细节都要对得上。”魏乔波说,以其中的《提书登记表》为例,提取古籍需详细填报当日采集计划、提取数量,然后与书库管理员共同清点每一函、每一册书,包括函盒、夹板、束带、铜扣的存缺程度,每一册古籍的题名、卷数、页数,以及有无破损、污迹或霉斑等情况,“这些都要一一记录在案。一送一回路上、数据采集期间,古籍若有半点闪失,都会被及时发现。”

  数字采集作业班班长杨旭勇告诉记者,采集时必须使用古籍专用非接触式扫描仪高清扫描,且光源必须是冷光源。对采集人员,甘肃省图书馆的古籍专家也开展了多轮培训演练,“既要保证扫描精度与进度,还要避免伤害古籍,翻书的力道不能轻也不能重,要稳而有力。”杨旭勇说。

  准备周密,工作前期进展顺利,意料不到的问题还是出现了。“古籍开本大小相同,厚薄却不一样。”宋学娟翻开一本书,拿到一台扫描仪前比划道,“超3厘米厚的古籍,用这种平板扫描仪扫描,靠近订口的部分内容很难被有效采集。”

  为啥?不按压,无法扫描;按压,古籍易损,且采集到的内容会变形。怎么办?“为保证采集质量,我们追加预算,在已采购10台古籍专用平板扫描仪的基础上,又购置了两台V型古籍扫描仪。”宋学娟说,使用这种扫描仪,只需将书翻开到90度,即可完成扫描采集,问题迎刃而解。

  2021年12月23日,开机扫描;2022年5月23日,采集告竣。“整整5个月,经过人员倒班,实现每天工作16个小时、一天未休。古籍没有丝毫受损,函盒没有增加一道划痕。”阳光透过窗口,洒在黄底黑字的《文溯阁〈四库全书〉数字化工作手册》上,宋学娟长舒一口气。

  数据处理

  数字文件与古籍真本如同孪生,最大程度呈现古籍原貌

  偌大的房间里,数十名工作人员神情专注、紧盯屏幕,只听见键盘敲击声此起彼伏。在读者古籍数字科技中心的数据处理室,采集来的文溯阁《四库全书》数据,将被加工成标准的数字文件,供后续影印出版和数据库建设之用。

  “数据处理有4道流程,图版处理、一校、二校和质检存储。”宋学娟介绍,其中图版处理是关键,主要工作是拼接完整“叶”。

  叶,古籍特有的量词。不同于现代书籍,古代纸张多为单面印刷,一张纸即为一叶,书册由一叶一叶对折后装订而成。一叶,相当于现代书籍的两页。所以,数字采集到的扫描件实则都是半叶,图版处理就是让它们合二为一。

  “最初,我们先在电脑上制作一个标准叶模板,再利用智能软件,从扫描件上提取文字,贴在模板上。”宋学娟告诉记者,但实际操作中发现,智能软件可能会漏字、识错字,且原本每一叶的版式不尽相同,模板统一后,有“失真”之嫌。

  数字文件与古籍真本,如何保持孪生一般的相同面貌?“我们摒弃了标准模板,选择了逐叶拼接,最大程度呈现古籍原貌。”宋学娟说。

  图版处理不易,校对任务也很繁重。文溯阁《四库全书》数据校对人员张静从事古籍校对工作已有10年,但从未校对过如此海量内容。利用数字技术能够提速,但一些讹误很难被发现。

  不久前,张静在校对时发现,一个“丸”字疑为“九”字。经仔细核校后确认,果然是因为古籍宣纸里的植物纤维发生霉变,扫描时多出了这一“点”。

  起初,一天校对300叶是张静的上限。“刚开始时平均用力,耗时较多。”她说,而今这个数字翻了近3倍,“慢慢地,哪里容易出错、哪里容易变色,心里都有了数,效率提高不少。”

  效率高了,胆子却小了。“总担心有错误没能及时发现。”张静回忆,有次下楼吃午餐,饭刚端上来,她又起身赶忙回到办公室,“以为忘了标注一处讹误,打开电脑一看,其实已经做了记录。”

  为明确权责,避免误操作,从图版处理到一校、二校,再到最后的质检存储,文溯阁《四库全书》数据处理是条“单行道”。电脑之间不能互相访问,数据传给下一流程后,前一流程的人员将无权再改。

  “在数据处理程序软件和制度流程上,我们有一套完整设计,确保数据资源安全。”宋学娟输入账号、密码,登录数字化成果管理系统,所有成品文件呈现在眼前,函盒编码、书名、作者、朝代,以及长、宽、高和册数等基本信息,都有详细记录。“我们争取今年内基本完成图版处理工作。”她说。

  影印出版

  不少图书馆、藏书机构等正虚位以待,静待“四阁四库合璧”

  文溯阁《四库全书》影印出版,汇聚了社会各界的期待。

  西北师范大学教授赵逵夫全程参与了文溯阁《四库全书》影印出版工程专家论证会。他说,《四库全书》现存不同版本在内容、册数、卷数上皆有不同,通过数字化影印出版,方便学者比对研究,意义重大。

  兰州大学教授汪受宽也持相同观点。他曾用两年时间,带着学生对甘肃省图书馆编印的《影印文溯阁四库全书四种》进行整理、标点和精细校勘,并将收录其中的《易图说》《长安志图》《墨法集要》《璇玑图诗读法》这4种(每种各1册)书,跟文渊阁本进行对比,发现两个版本的文字、图片等存在901处差异。

  “4册书就有这么多差异,3.6万多册会是什么样?”汪受宽说,“文溯阁《四库全书》影印出版,将对文化史、史学史、文献学研究等都产生重要影响。”

  期望值高,现实问题也不少。一方面,古籍实现数字化后,盗印现象难以杜绝。另一方面,超大规模古籍的影印出版投入巨大,盈利是个难题。“变古籍为现代书籍,背后是大量的人力、物力、财力成本。”读者出版集团有限公司所属甘肃人民出版社社长、总编辑原彦平坦言。

  防止数据泄露,采集区域设置严密安保措施。宋学娟介绍,任何人出入采集区,都须经过严格安检,以防手机等电子设备进入工作区域。同时,每个工作台均安装了监控设备,每台电脑都作了加密设置。

  应对盈利难题,找准盈利点是关键。原彦平给记者详细分析:古籍影印本主要有仿真本和缩印本。前者好比是“克隆体”,从纸张到字号,从排版到装帧,与原书几乎“一模一样”;后者则是“迷你版”,内容不变,但字号变小、页数变少,册数大幅缩减。“文溯阁《四库全书》若是出全套仿真影印本,成本过高,市场较小。”

  原彦平说,文溯阁《四库全书》多达3.6万余册,数据采集、处理、编辑、出版等投入大,且多为手工完成,成本高,发行对象则主要为图书馆、文化馆、高校、研究院所等专业机构和为数不多的研究者。

  2024年1月3日,文溯阁《四库全书》经部影印出版专题工作会议召开,确定了出版方案——缩印、16开本、236册。“我们将按经、史、子、集四部,分期分批推出缩印本。如果全套出齐,预计共1500册。”原彦平说。

  走进甘肃省图书馆的古籍阅览室,其他三阁《四库全书》的影印本旁,工作人员已为文溯阁《四库全书》的影印本腾好了书架。

  “古籍影印本看似小众、销路窄,实际上,版本好、印刷精美、定价合适的古籍,自有其发行空间。”从事出版行业20多年,宋学娟对文溯阁《四库全书》影印本的市场前景颇有信心——版本独一份,价值突出,公众期待较高;自带流量和话题,营销成本较低,做到客户明确、精准供给,就能减轻销售压力。

  今年初,宋学娟带领团队参加2024北京图书订货会。文溯阁《四库全书》全套影印出版工作颇受关注,不仅有高校、图书馆、文博机构的负责人,还有销售商和个人前来咨询。“据市场调研,不少图书馆、藏书机构等正虚位以待,静待‘四阁四库合璧’。”宋学娟说。

  “在做好保护工作基础上,我们将深入挖掘文溯阁《四库全书》价值,努力在信息服务、文化创意、文旅融合上求突破,让这座资源宝库在新时代活起来、用起来。”读者出版集团有限公司党委书记、董事长梁朝阳表示。

  活化利用

  首推精选本,开发文创产品,让更多人领略古籍魅力

  “宣传推广古籍的文创产品,既要开发周边,更要聚焦古籍本身。”甘肃省图书馆馆长肖学智说,不妨跳出杯子、本子、袋子等样式,回归古籍做文创,出版精选本图书。

  汪受宽介绍,《四库全书》历来有“典籍总汇,文化渊薮”之誉,不仅囊括了从先秦至清代乾隆中期之前中国历史上的主要典籍,而且涵盖了中国传统学术文化的各个学科门类和各个专门领域。

  “卷帙浩繁通常也意味着无从读起,从这个意义上讲,让‘高冷’的古籍变畅销的书籍,就是好文创。”肖学智说。

  启函盒、取夹板、解束带,《文溯阁四库全书影印精选》露出真容。翻开书页,映入眼帘的楷书温润大方、赏心悦目。每页8行、每行21字,虽是手抄,可字的大小、间距几无差异,工整如打印一般。

  “共计40卷,分为3函、5种、18册。”肖学智介绍,为突出甘肃文化特色,这套影印精选本甄选了文溯阁《四库全书》子部所收古代陇人著作两种——《潜夫论》和《拾遗记》,另外还有《文房四谱》《法书要录》《画史会要》等书画艺术史经典作品3种。

  这样一套精装古籍,俘获了不少读者的心。“自去年5月出版发行,迄今已销售680多套,平均每天销售约2套,这在古籍中销量不低。”甘肃省图书馆文创中心负责人介绍,甘肃省图书馆10多年前就曾出版《影印文溯阁四库全书四种》,畅销至今,共售出5600多套。

  “优质的古籍,就是优质的文创。”肖学智说,近年来,甘肃省图书馆以文溯阁《四库全书》为素材,从其包装方式、撰写格式、用色寓意、人文理念等角度汲取灵感,推出了一系列文创产品,“目前,我们正挖掘文溯阁《四库全书》中的龙元素,即将推出特色伴手礼。”

  “古籍活化,不能止于开发文创产品。”肖学智说,为了让更多人乐于走近文溯阁《四库全书》,领略古籍魅力,甘肃省图书馆打造了多个文创场景——线上,推出“文溯·陇迹”等专栏,在“云”上赋予古籍新话题;线下,建成甘肃省图书馆文溯阁《四库全书》藏书馆展厅,让参观者沉浸式体验纂修、流传、保护、发展等历史场景,与“书”同行……

  “我们举办的‘千古巨制——《四库全书》展’是国内较早推出的《四库全书》专题展览,至今已在全省50多个图书馆流动展出。”肖学智介绍,今年3月,省图书馆还启动了专题展览进校园活动,未来还将推动展览进社区。

  年轻读者马瑛正是通过这个展览认识了文溯阁《四库全书》,并买了一套《影印文溯阁四库全书四种》。“带回去,让更多人了解我们的典籍瑰宝。”马瑛说。

  今年,甘肃省出台《关于以“八个一”文化品牌为抓手全力推动文化传承发展的实施方案》,其中一个“一”即为“一部《四库全书》,让中国古典文化活起来”。实施方案提出,加强文溯阁《四库全书》保护传承、整理研究、数字转化、版权开发、活化利用等,激发古籍保护利用活力。

  “影印出版,是活化利用的第一步。”肖学智说,未来还将建设完整、好用的数据库,研发音视频等产品,让文溯阁《四库全书》的“数字分身”走进千家万户。

  《 人民日报 》( 2024年05月31日 13 版)

(责编:袁勃、赵欣悦)