图书首页 | 专题 | 连载 | 新闻 | 书评书摘 | 访谈 | E-book | 书城 | 组合查询
热点推荐

丹·布朗 多丽丝·莱辛 郭敬明 米兰·昆德拉 奥尔罕·帕慕克 村上春树 钱文忠 余秋雨 黎东方

您的位置:易文首页>>图书频道>>评介

拥抱“大数据”对历史研究的挑战

2018-5-30 15:24:40 来源:易文网

  (代序)

  一

  梁启超先生在谈到史料对于史学发展的重要性时,把史料喻为“史之组织细胞”,认为“史料不具或不确,则无复史之可言”。傅斯年先生也强调,若要不断地使史学发展、层累,就必须不断地收集资料、挖掘资料。近代以来,研究者一直孜孜不倦地扩充史料来源,扩大研究范围,“上穷碧落下黄泉,动手动脚找材料”即体现了对获取研究史料的重视。随着科技的进步,尤其大数据时代的来临,史料的获取、存储、交流、再生产等诸多环节发生深刻变化,一个突出的表现就是数据库的蓬勃发展。英国著名学者魏根深(Endymion Wilkinson)在其著作《中国历史研究手册》(以下简称《手册》)的弁言中介绍了《手册》的四个重要目标,其中之一就是“突出利用电子资源对中国历史资料进行传播、归类和分析,这些资料上起商代甲骨文下到最近的中外学术研究”,还提到《手册》选择了225个数据库(此外还有数以百计的原始资料及参考著作的电子版),并强调“中国历史和考古研究领域在过去的十年中飞速变化,数据化亦改变了人们研究的方法,本书试图跟上这些新的发展”。

  就国内而言,2010年以来,仅国家社科基金支持的、以数据库建设为核心的文史研究项目就不下70项,这两年来增长尤甚。资料的数字化改变了历史研究的资料来源,数字资源的采集、加工和处理对研究成果的取得作用日益显著,如何理解历史学在大数据时代下的发展就成了一个重要的课题。

  首先,我们来回顾一下国内史学类数据库的发展历程。尽管数据库技术滥觞于20世纪60年代末,但是直到80年代,国内的人文学科才逐渐开展数据库的建设工作。就史学类数据库的建设来看,迄今大体可以分为三个阶段:

  第一阶段主要为数字化制作、整理阶段,重点在于资料的输入与整理,制作成电子光盘。如在1985年,台湾“中研院”历史语言研究所便启动了“汉籍电子文献资料库”的建设工作,内容包括“二十五史”“十三经”以及超过2000万字的台湾史料、1000万字的大正藏、道藏、清代经世文编等大型类书、丛书,收入典籍达460多种,计4亿多字。此阶段使用的范围更多限于电脑单机,改变了知识的存储形式,体现了携带方便、易于查询等优势,完成了从旧时的汗牛充栋到如今大容量可移动介质的重大转变。

  第二阶段始于20世纪90年代中后期,在互联网兴起后,各类数据库的建设和上线层出不穷。如中国知网、超星图书馆的上线为论文和图书的查找提供了巨大的便利。就专业的历史类数据库的开发而言,尤为突出的是北京爱如生公司研发制作的“中国基本古籍库”,该库分4个子库、20个大类、100个细目,精选了先秦至民国的历代重要典籍,总计收书1万余种,全文超过17亿字。其他一些主要的全文数据库,如书同文古籍数据库、中华经典古籍库也广受欢迎。全文数据库比较直观,就像把一本纸书变成电子文本,然后我们在这里面抓取所需文本,其中原理跟搜索引擎颇为类似,而且也不需要什么培训就可以上手使用。此外还有一些专题类型的数据库,如中国金石总录数据库、东方杂志全文数据库等也已陆续上线。除了相对商业化的文献数字化机构,还有各公共图书馆、高等院校等都有为数不少的古典文献数据库,如中国国家图书馆的电子文献也比较丰富,有数字善本、甲骨世界、碑帖菁华、敦煌遗珍、西夏文碎金等经典文库,另有其他各色常见的古典文献。

下一页

http://www.ewen.co

    



|公司简介|广告服务|联系方式|

中华人民共和国
互联网出版许可证
新出网证(沪)字001号

沪ICP证020698

版权所有:上海数字世纪网络有限公司  
2001--2008  ver 3.00