2022年4月,中共中央办公厅 国务院办公厅印发《关于推进新时代古籍工作的意见》,旨在集全国各古籍单位之力,采用最新、最规范的形式,共筑新时代下古籍工作之大成。根据意见精神,全国图书馆标准化技术委员会与浙江大学图书馆联合举办了图书馆古籍存藏保护实践与标准专题培训班,我校图书馆古籍部集体参与了此次调研与培训活动。
3月25-26日古籍部馆员调研了国家版本馆(杭州分馆)的馆藏古籍版本情况,加深了对馆藏古籍版本演变和流传的认识,更直观地对比了宋刻本(天禄琳琅藏书)与其他朝代版本的版式区别。
3月27-30日参加了在浙江大学(紫金港校区)图书馆举办的图书馆古籍存藏保护实践与标准培训会议。会议内容围绕智慧图书馆与智慧古籍、古籍保护与古籍工作、古籍元数据规范、古籍修复技术规范与质量要求、古籍原生性保护与数字化利用、图书馆古籍特藏书库、古籍函套等技术要求进行了专题宣讲。
本次调研与培训使图书馆在古籍存藏保护与数字化方面收获了业内专家的技术性指导和业界新知。同时,古籍部馆员与业界同仁在会后进行了交流与探讨,加强了与全国各古籍单位(部门)之间的沟通与交流,增强了我校图书馆古籍工作的专业性和前瞻性。
时隔十年再次听浙江图书馆古籍部陈谊老师的讲座,他从古籍工作与古籍保护的八问八答,引入了“古籍大保护”的概念,解答了古籍工作的规划与设计,古籍数字化,古籍研究、古籍保护和古籍推广之间的关系,古籍工作的多维性和工作中人的能动性等接地气又共性相关问题。古籍原生性保护离不开修复用纸的甄选,我们考察了浙江大学古籍馆修复用纸的纸库建设,对汪六吉、红星、富阳及国外的不同修复用纸进行了了解,为我馆古籍修复用纸采购提供了方向。利用课余时间我们调研了三家古籍数字化公司,详细了解了目前古籍数字化、古籍OCR识别及CRUSE扫描的发展及利用率等。
古籍是古人知识的载体,是历史的传承,但由于历史上造纸和印刷技术的局限,使得古籍较为稀少,又有多次书厄,使得古籍存量较为稀少,其中又遇战乱遗失、传抄错误、避讳帝王等问题,导致古籍各版本之间存在较大,所以古籍既有文物价值又有文献价值,因此国家重视古籍的保护与传承,召开了本次古籍保护会议,从多方面制定标准,进一步规范古籍保护和利用。
其中,尤为精彩的是周崇润专家重点介绍了为什么随着年代的增加古籍纸张会出现老化,周老师通过试验数据详细介绍了纸张酸PH值偏低的纸张会导致纸张老化加速,出现纤维断裂,缩短书籍寿命。其针对不同年代的纸张分别测定了PH值,列表中表明,民国时期的纸张PH值最低,最低值趋近3.5,呈现严重酸性,所以民国时期的纸张保存期限最短,老化最快,这也解释了为何民国书籍保存至今,发生破损的情况反而比年代更久远的古籍更为严重的原因。而这一原理也提醒我们,尤其要注意书籍函套的制作过程。因为对于破损的函套,古籍保护单位常常制作新的函套加以替代,而制作函套的纸制品有的是回收利用的纸板,也有专业的纸板,其中的PH值各不相同,相对低的PH值纸板反而会对书籍产生潜在危害,而制作函套所用的胶水,也是容易忽略的部分,经试验测试,某款日产专业古籍胶水,PH值竟然十分低,呈严重的酸性,不宜用于古籍修复与作函套制作,所以对于古籍相关用品与所处环境,都需要严格把关。
在阴雨绵绵的三月,有幸下江南参加了古籍项目组版本调研和图标委组织的古籍培训活动,感触与收获巨多。此次培训强化了作为古籍工作者的专业性与规范性思维,拓宽了古籍工作视野,增进了古籍业界同仁的学术交流与情感,现将个人在培训中收获的有关古籍工作的新知、认知和理念做以分享。
首先,会议对古籍数字化、存藏、修复等工作的规范标准做了宣讲,使我感受到了平时工作中耳濡目染的古籍工作的神圣性,强化了古籍工作的专业性和规范性思维。其次,“智慧图书馆与智慧古籍——从数字化到智能化利用”以专题分享了大数据视野下的古籍整理智能化问题,包括自动标点与古代文献整理、超分辨率与古籍图像增强、古文具箱的设计与开发,并以视频形式演示了“中文古籍OCR”开放在线体验。介绍了“吾与点”智能化古籍整理平台,阐释了将提供图片文字识别、自动句读、命名实体识别三项基本古籍整理功能予以实际应用的可能性。
令我触动最大的是国家图书馆古籍馆副馆长、研究馆员谢冬荣老师的会议分享。专家们回答了我们眼下关注的ChatGPT与古籍工作的关联问题。因为其研究很具图书馆未来发展的前瞻性和时代性,又是图书馆工作者与时俱进无法回避的问题,所以,将这部分收获通过这种文字形式,分享给大家。
谢老师通过介绍人工智能大模型、大数据、大算力的优势,引领参会者思考了当下三个热门问题。初级问题:ChatGPT(Generative Pre-trained Transformer)是什么意思?回答:是基于生成式预训练变换模型的对话,与Google BERT的区别,后者是基于变化器的双向编码器表示技术。中级问题:涌现是什么意思?回答:当大量相似的实体彼此之间以及与所处环境在低尺度上相互作用时,更高的时空尺度上就可能自发产生许多意想不到的结果。这种非同小可的现象被称为“涌现”,强调这是各类复杂系统都有的特征。高级问题:ChatGPT与元宇宙有什么关系?分享者引用了国际知名专家的。回答:元宇宙会发展成一种新的软件容器,就像手机一样,成为一种计算机交互方式。而AI则是一场技术革命,所以问题应该是“元宇宙如何融入AI新世界”,而不是AI如何融入元宇宙。最后,是对古籍GPT与智能化利用问题进行了思考。利用现有古籍智能搜索软件演示了未来古籍GPT的发展方向和趋势:能够准确识别一段古文献信息,并能自动句读,译成白话文,翻译成其他国际语言,提取其中的地名、时间、官职、人物姓名等信息。以“华佗GPT”为例,介绍数据集的特点,让我们了解到它是目前规模最大的中文医疗问答数据集,也是目前规模最大的医疗真人对话数据集。在古籍GPT与智能化利用上,建议未来能用一个初始化好的GPT模型,用ChatGPT反馈代替人类反馈,利用已有的古籍文本资源建设中文古籍开放语料库,利用已有的人名辞典、地名辞典、职官志等建设开放标引平台,实现与公司合作建设中华古籍GPT的目标。
期间,分享者还向所有关注元宇宙、人工智能、ChatGPT问题的人推荐了一本名叫《雪崩》的书,建议要先看这本书,将有助于深入对人工智能等问题的思考。在此,一并向我馆同仁荐购此书,让更多人了解它。
最后,保护传承民族优秀传统文化,人人有责,任重而道远!
复旦大学图书馆副馆长杨光辉在报告中从历代书厄入手,引入了古籍保护的基本概念,认为古籍保护作为一个跨学科、行业、地域的综合性学科,其内容包括实物载体、保藏环境、修复技艺及编目鉴定。继而从建筑、人文、科技三个方面阐述了他对于古籍保护的认识,由古至今、由内及外,向我们呈现了:皇史宬、四库馆、版本馆的公家藏书保护;天一阁、嘉业堂的私家藏书保护;耶鲁大学、加州大学柏克莱大学分校美国公私保护;哈佛、斯坦福大学、哥伦比亚大学的人文保护;梵蒂冈、芝加哥大学、汉堡大学的科技保护。
杨馆长介绍了复旦大学中华古籍保护研究院围绕古籍的载体—纸墨写印材料开展的基础理论研究,主要包括纸张生产、使用中的基本科学原理与纸张老化机制研究,例如制造纸张植物的基因培育,化学、物理、微生物等因素在纸张保藏过程中的损伤影响,纤维降解机理与纸张寿命模型构建及纸张寿命测试等。
关于古籍利用,杨馆长提出了几点建议:1.结合国际已经开放的古籍资源,如哈佛燕京等相关机构的古籍数字资源开放平台,建古籍数字资源联合检索平台,例如“国际敦煌计划”。彻底改变“燕京很近,北京很远”的历史;2.在信息无限膨胀的背景下,“全文索引等于没有索引”,建议推动古籍索引国家标准制定,结合数字人文,按历代人名、地名、书名、物产、机构等推进专题古籍索引数据库建设,深度揭示古籍资源;3.当下民间古籍书源日渐枯寂,建议国家出台特殊政策,将国内公藏机构三个以上的复本古籍释放出来,建一个类似孔夫子旧书网的网络共享交易平台。节约大多数收藏机构的物理空间,促进古籍流通活化利用,并且避免“数字化重复”建设。
乾隆时期修编的《四库全书》可以说是至今全世界最大的一部丛书,说起这个名字也无人不知无人不晓。当时为了这部丛书的保存共抄写了四份,放到七个地方进行保存,被称为“南三北四”。
北四阁之书如今存三部,分别为文溯阁、文津阁、文渊阁,而南三阁独存文澜阁,其他二阁全在太平开国时损毁,其中的书也所剩无几,唯有文澜阁的书烧毁的比较少,并流于民间,后经过八千卷楼主丁丙、丁申的搜集补抄,加之民国时期及建国后的两次补抄,基本完成了原《四库全书》的体量,也就成就了我们今天所能见到的文澜阁《四库全书》。
这次学习会务组专门安排了参观文澜阁,说实话已向往很久了。
文澜阁座落于西湖中的岛上,现属于浙江省博物馆(孤山馆),此阁也非当年乾隆时所建,而是因战争损毁之后于光绪年间重建,基本上保留了原阁的样子。
文澜阁正厅有两层,这两层紧密的排列着装书的柜子,应是之前装这部《四库全书》用的,如今虽有机会参观,但书并没有在这,这部书已放到了浙江省图书馆古籍部精心的保存起来了,历经岁月苍桑、风雨艰辛,他或许更喜欢的是安静吧!
会议掠影