档案馆也是“大数据库”

档案馆也是“大数据库”

牛皮纸袋、泛黄案卷纸片、铁质文件柜……这是档案馆的昨天,在万物互联、人工智能的时代,越来越多的传统档案馆正在变身为充满科技因子的“大数据库”。

『档案馆,在传统认知中是一座尘封历史记忆的神秘宝库,人们想象着库房厚重的大门背后锁藏着多少不为人知的史实。

牛皮纸袋、泛黄案卷纸片、铁质文件柜……在普通人的印象中,组成了档案馆的元素标配。然而,在万物互联、人工智能的时代,越来越多的传统档案馆开始转变。它们逐步变身为充满科技因子的“大数据库”。那些泛黄纸片、老旧胶卷、手写文本一一被数字化,以电子文档的样貌留存时光。

无论是西方传说中司档案的雅努斯神,还是被我们尊为档案界“老祖宗”的司马迁,可能都无法想象历史变迁下的档案工作会迎来如此巨变。但是,档案馆到底要不要成为“大数据库”?如同当年讨论电子阅读和纸质阅读的关系那样,大家依然众说纷纭。』

▇ 开放利用还是划控管理

近日,重读涂子沛《大数据:正在到来的数据革命》一书,颇有启发。这本书通过讲述美国半个多世纪信息开放、技术创新的历史,以奥巴马建设“前所未有的开放政府”、《数据质量法》背后的隐情、统一身份证的百年纠结等案例,细解数据创新不仅推动商业智能革命,而且将对政府职能转变、社会治理、公民生活方式等带来更多变革与挑战。

书中还生动讲述了政府信息逐步开放过程中,围绕大数据资源的各种新旧思想冲突、部门数据资源的利益博弈,以及政府、企业、社会之间的立场纷争等,对于把握大数据环境下推动档案公共服务等提供了教训和借鉴。

文中有一段话,读来犹有感触:“从古至今,所有政府,都带有保密、封闭的文化基因。虽然一谈到透明和开放,大部分人都会认可这是正确的价值观,但一旦要自己透明、要自己开放,那开放和透明就立刻变成了一种威胁。面对庞大的公共信息,政府首脑的第一反应往往是安全第一、保密第一,具体到一线工作人员,也是‘多一事不如少一事’,直接打上‘保密’的标签,最为简单省事。”

文中还谈到了建立开放数据平台的种种争议,包括原始数据之争、数据安全之争、数据质量之争、数据粒度(数据的细化和综合程度)之争、数据价值之争、网站虚实之争等。自2015年我国迈入大数据时代开始,政府大数据平台加快建设,类似争议在档案界业内也是甚嚣尘上。双套制还是单套制?数字化的档案资源是不是公共数据?开放利用还是划控管理?这些问题虽然不能直接从书里找到明确答案,但也能有一些类比参考。

▇ 别成为故纸堆的“坟墓”

数据驱动的智能时代已经到来。没有大数据思维,只能被时代淘汰。

毋庸置疑,我们已经身处一个信息技术高速发展的时代。在这个崭新的时代,不仅新技术更新迭代迅速,而且政治、经济、社会、文化等在信息技术渗透下都在发生深层次变革。“万物皆联网、无处不计算”成为现实。云计算、区块链、人工智能……这些词语不再只是科技术语,而已成为现实生活中看得见、摸得着的应用。

在大数据应用的滋养下,“互联、共享、系统、关联”的大数据思维逐步成为社会共识。档案工作当然不能置身事外。如果档案馆里只能存放纸质档案,而忽视了对越来越多的电子档案的管理工作;如果档案工作者看不到档案的大数据价值,而仅仅把现有馆藏的几百万卷(件)纸质档案作为尘封记忆,那么档案馆也许有一天将面临无档可归的地步,或者真将成为故纸堆的“坟墓”:一方面,放弃了对当下最为活跃、最为生动的历史的记录;另一方面,也失去了活化和开发档案价值的有效手段和空间。

因此,存量数字化、增量电子化,理应成为一个共识。不仅档案界应当更加迅速地行动起来,社会各个领域也应当把广泛建立数字档案室、数字档案馆作为重要工作。不然,那些电脑里的电子文档、设计室里的数据图纸、数据库里的表格视图,恐怕都将无迹可寻,成为历史尘埃。

公共数据开放利用是社会进步所需,选择故步自封、墨守成规终将输给历史。实践证明,开放的经济、开放的社会和开放的政府是人类社会得以进步的基础。近年来,我国高度重视政府数据开放利用工作。以往各自封闭、互不联通的数据资源得到整合和提升,成为服务社会、服务人民与推动发展的重要动能。

习近平总书记指出,加快政府大数据平台建设是提高社会治理能力和水平的迫切要求。各级党委和政府要强化互联网思维,善于利用互联网优势,着力在融合、共享、便民、安全上下功夫。同时,进一步拓展为长三角异地查询服务,推动区域档案数字化提档增速与共享互联。

当然,并非所有的档案都是可开放利用的公共数据。相当一部分档案具有保密性、隐私性、敏感性等特点,需要依法依规予以严格划控和管理。这是由档案天然所具有的政治属性、机要属性所决定的。但这并不是把档案工作和大数据割裂开来的理由。许多档案特别是民生档案取之于人民、产生于基层,在依法合规的前提下,应当作为公共信息和数据予以开放利用。

档案,从来都是紧跟时代而发生形态变迁的。结绳记事、石刻碑铭、金帛绢书、文案卷牍……无不是档案记录原始和真实的载体。如今,大数据时代又为档案工作赋予了新的数据能量。在大数据的视野下,各级各类档案史志馆不仅仅是一座史料宝库,而且会成为一个海量字节的“大数据库”。

档案馆也是“大数据库”

《大数据:正在到来的数据革命》

涂子沛 著

广西师范大学出版社


分享到:


相關文章: