广大朋友们,关于“构建中医药数据资源结构图谱的探讨”是由精品学习网论文频道小编特别编辑整理的,相信对需要各式各样的论文朋友有一定的帮助!
本研究通过分析中医药数据库资源的类型、特点和中医药资源存在的问题,提出基于现有数据库资源与结构,参考现有资源整合技术,从数据层、物理层、基础层3个方面入手,并结合体系构建等相关的资源深层整合技术,探讨构建中医药数据资源结构图谱的实际解决方案。
1 中医药数据资源现状与问题
中医药数据库建设工作起源于1985年,目前,已经建立了覆盖中医药学科的复杂的多类型数据库,总数据量约200 G,文献数据库收集年代跨越58年。数据库建设主要包括单表数据库、结构性数据库和数据平台的建设。目前,中医药现代资源数据库的建设已经具有一定的规模,已经形成以中医药科学数据中心与分中心为主体的中医药文献型及事实型数据库群,几乎涉及到中医药信息的方方面面。 然而这些资源库群是彻底异构的,从数据结构、操作系统,到数据库系统、应用系统;从命名方式,到数据格式、结构模型、用户界面,都有可能完全不同,目前还没有标准规范能够对这个各个层次的异构进行适当的约束。中医药科学数据中心缺少完整解决方案。1.1 局部有序、整体无序 从某一种具体资源的角度来看,他们都是经过一定程度加工整序,具有统一的分类体系和检索界面。但从全局的角度来,中医药科学数据中心拥有的各种资源是一个个的“信息孤岛”, 各种资源内容交叉,信息重复,关联度低,用户查找资料时不但要在多个数据库中来回穿梭、重复操作,还要精通各种不同数据库、不同界面的数字资源系统检索技术,否则便难以查全或查准所需要的资料。
1.2 数据结构与标准不统一
各种不同类型的数字资源不但采用Oracle、mySQL、SQL、Access等不同的数据库物理模型或半结构、非结构的数据结构,而且在对资源的描述与揭示时没有采用元数据、数据元、数据模式等标准。数据库字段与数据表命名差异性较大,例如:“ZZ”表名对应数据字段名就有“主治”、“著作”、“作者”等。
1.3 数据来源多途径与数据版本复杂
中医药数据资源是指中医药科学数据中心与分中心收集的各类型专业数据,这部分资源数量众多,构成了学术数字资源的主体,现已成为重要的文献来源。从文献类型上看,有期刊、图书、会议论文、学位论文等;从文献级别上看,有题录、文摘、全文等不同的层次。自建数据库有多种载体、多种形式、多种类型、分散异构的信息资源,这些数据库形成时间长,数据更新多次,缺少清晰的资源定义与描述。
1.4 系统平台与应用程序各异
各种不同类型的数字资源有着不同的系统平台;不同的数据资源存在着过程数据的不同服务方式,例如:期刊文献数据库、结构型文献数据库、分析结构型文献数据库;同时,数据表存在着基础数据库、粗表数据库、细表数据库、单元素数据库等,部署在共建、共享的服务器上,也给数据管理带来麻烦。
2 数据资源与结构整合技术
2.1 数据资源整合
整合的实质就是各个单独事物共同遵循统一的原则、标准、规定,打破原来的界限形成有机的统一体。数据资源的整合[1],英文可译作“digital resource integration”,就是通过各种手段和工具将已有的信息资源集成起来,并按照一定的逻辑关系进行组织,实现信息资源的有效共享,为用户提供条理化的信息服务,为后续信息的管理与使用提供规范,从而实现信息的增值利用。
数字资源整合主要集中在数据集的整合和应用的整合两个方面,再具体细分还可以划分为数据集成、信息集成、信息系统集成及业务(或工作流)集成等4个阶段。
通常数据资源整合的范围可以包括4个方面。①数据整合:数据标准、主题数据库、数据交换平台、基于语义的全局数据视图。②应用整合:使用统一用户认证、使用统一的数据交换、使用门户实现应用集成。③内容整合:信息规划、信息导航、统一搜索、信息专题、信息门户。④流程整合:统一数据采集加工处理流程、统一数据存储管理、统一数据访问和调用接口。
信息资源整合根据系统论的原则,依据一定的需要,对各个相对独立系统中的数据对象、功能结构及互动关系进行融合、类聚和重组,重新构建一个新的有机整体,形成一个效能更好、效率更高的新的信息资源系统。目前,数字资源整合的方式主要包括:基于OPAC资源系统的整合、基于数字资源导航的整合、基于异构数据库跨库检索的整合、基于数字图书馆应用系统的整合等。
2.2 数据资源整合技术
相关推荐: