教育装备采购网
第七届图书馆 体育教师课题研修班

机构知识库可持续发展策略研究

教育装备采购网 2013-02-01 16:21 围观2004次

  机构知识库可持续发展策略研究

  钱建立[1],李鹏[2],李若溪[3]

  1: 《电子设计工程》杂志社 西安 710075

  2:陕西省科技信息技术研究所 西安 710054

  3:《重庆师范大学学报》编辑部 重庆 400047

  摘 要:剖析了目前国内外机构知识库存在的“鸡肋”现象,把原因归结为没有很好兼顾机构构需求和成员需求,提出知识服务平台除了被唯一化的机构公开成果库功能外,还应具备内部资料库、异构资源互联、成员资源集聚、知识再组织、科研秘书、团队协作、科学社区等七种功能,为学习和科研提供有价值的服务。认为让科研人员在享受到有价值服务的同时,又不需要付出太多额外劳动,而能实现机构知识的自动集聚,是解决机构知识库建设的“最后一公里”瓶颈的方向,并设计了个人成果收集的具体实现方案。

  关键词:机构知识库,知识管理,知识再组织,科研协作,文献管理,科研助理

  分类号:G255.75 文献标识码 A 文章编号 1002-1965(2012)11-0176-05

  On Sustainable Development Strategy of Institutional Repository

  Qian Jianli1, Li Peng2, Li Ruoxi3

  (1 Electronic Design Engineering Magazine, Xi’an 710075)

  (2 Shaanxi Provincial Scientific Information & Technology Institute, Xi’an 710054)

  (3 Journal of Chongqing Normal University Editorial Office, Chongqing 400047)

  Abstract: There is few reasonable considerations on both institute requirement and member requirement is regarded as the main reason of institutional repository’s “chicken ribs” phenomenon. To change the situation, Institutional Repository should provide valuable service for learning and research. Besides of institutional public works exhibition, IR should also support internal material database, interconnection of Heterogeneous resources, concentration of member resources, knowledge reorganization, research assistant, team coordination and science community, so that researchers can enjoy more valuable services without inputting too much extra labor, and the automatic concentration of institutional knowledge may become much easier. The scheme of personal works collection is also designed.

  Key words: institutional repository; knowledge management; knowledge reorganization; team coordination; science community

  0 引言

  机构知识库(Institutional Repository, IR)目前正在得到广泛的重视,从高校[1]、研究院所[2],正在扩展到政府部门和企业。然而对于机构知识库的定义则存在不同的理解,也导致了目前机构知识库不同的结局。金春梅把之前机构知识库的定义归纳为两大类[3],一类是以美国网络信息联盟的常务董事Clifford A. Lynch为代表的“IR 是一种服务体系”,认为“机构知识库是指大学为成员提供的管理、传播自己创造的数字资料的系列服务”[4]。另外一类是以SPARC 资深顾问Raym Crow为代表的“典藏、展现说”,认为机构知识库是某个大学把其师生创造的数字知识进行永久保存,用来提升声望”[5]。

  这两种定义存在一个共同点,就是限于机构“生产”的数字资源。目前大多建设起来的机构知识库,大多基于以上两种定义。

  国内外研究机构之所以对机构知识库有如此热情,是因为已经有很多成功的案例。麻省的教案仓储影响到了中国[6],俄罗斯数学家因2002年在Arxiv上存档的一篇论文获得了2006年素有数学界奖诺贝尔奖之称的菲尔茨奖[7],Stanford大学的HighWire[8]已经在清华大学建立了影像站点,Lord大学的DOAJ也成为了开放存取期刊存档的旗帜[9]。

  然而遗憾的是,在目前已经建起的2040个机构知识库中[10],能引起关注的,为数寥寥,很多机构知识库沦为了“鸡肋”。除了“典藏”功能外,提高机构作品影响力的这一点期望,也因为大多研究人员更希望从来源更广泛的专业数据库来查询资料,也变为了“空中楼阁”[11]。

  从韩珂的调研中,可以对目前很多机构知识库没有达到预期效果的原因可以管窥一斑[12]。

  1) 研究人员获取信息的渠道更倾向于涵盖国内外研究成果的专业数据库,而不是从仅有一家机构成员的机构知识库。

  2) 仅有2%的研究人员愿意“自主提交”文献,大多数研究人员认为机构知识库建设是机构方的事情,最好由知识库管理员来协助提交。

  3) 在机构知识库上存档的作品得不到官方的认可,99.5%的研究人员更愿意在传统期刊上来发表自己的作品,只有0.6%的研究人员选择机构知识库。

  这些原因可以归纳为两点:

  1) 机构成员在机构知识库建设中,义务多于获得的服务,甚至在一些机构是只有义务,而没有任何有实用价值的服务。

  2) 机构知识库还停留在机构公开成果库阶段,未能把机构中大多有价值、特色的知识作品进行整合。

  中科院国家科学图书馆对机构知识库的定义让人对机构知识库的未来变得重新充满了希望。“机构知识库是研究机构实施知识管理的工具,是机构有效管理其知识资产的工具,也是是机构知识能力建设的重要机制[13]。”在这个定义中,机构知识库的范围从机构的“知识产品”扩展到了“知识资产”。“产品”是自己生产的产品,而“资产”则不仅仅包括自己的产品,也包括购置的知识产品。

  笔者认为,机构知识库应该是把机构内各种系统、各个团队、各个成员散存的各类知识成果的记录、集成、再组织、展现,展现机构成果,盘活机构知识资产,为成员、团队提供学习、科研服务支持。

  1 机构知识库的功能分类

  知识库建设的投资方和建设方位机构,但其使用者和参与者为机构成员,因此机构至少说要想可持续发展,必须要同时满足这二者的需求。

  图1是机构知识库的机构属性功能和服务属性功能。

  2 机构知识库功能的机构属性

  2.1 公开成果库

  目前大多已建成机构数据库基本都实现了这个功能。这个功能分解、扩展为:

  1) 机构科研成果的“档案馆”、“橱窗”和 “展示厅”。

  2) 贡献者的“光荣榜”。为机构做出贡献的研究人员,理应得到致敬和褒奖,机构也应该记住那些做出贡献的人。

  3) 机构成员积极价值观的“课堂”。弘扬先进,就是明示机构的价值趋向。

  4) 机构影响力的“助推器”。如果能把机构成果开放存取,对提高机构和作者影响力能起到一定的促进作用[14]。

  2.2 内部资料库:过程文件、实验记录档案馆

  在科研机构,发表、通过验收和评审的最终报告、方案、论文、专著、专利,固然是一个机构的成果和财富,但那些实验数据、培训教程、讲座、过程文件等非公开发表文献,同样有着重要的价值。

  1)非公开文献的针对性更强

  和购买的文献、数据库相比,一个机构的实验记录、历史文档,和实际工作往往有着更密切的关联,因此对一个研究机构有着更现实的价值。

  2)未公开发表文献,也具有参考价值,甚至更高

  这些没有公开的文件、记录同样花费了精力、心血、时间、经费。

  由于论文篇幅的限制,有些详细的实验记录无法全部发表,而具体数据对后来的研究人员来讲往往更有价值。

  即便是结果失败的研究,也能成为后来者的“前车之鉴”。

  3)社会更需要非公开成果档案

  公开成果已经有了专业数据库,如知网、万方期刊数据,国家专利数据库,而目前非公开成果的数据库还很少,研究人员获取实验记录等非公开文献的需求更迫切。由于目前公开的实验记录库还很少,这方面的努力更能提升机构影响力。

  非公开成果包括:试验记录、报告草稿、教案、PPT、视频、培训教程、工作规范、源程序、设计文档、需求文档、产品使用手册等。

  考虑到非公开文献,可能涉及机构、部门、个人机密,因此其访问范围可以分为公开、机构内、群组内、特定成员间;访问权限可以分下载、评议,可设置为不同的访问权限组合。

  麻省理工大学开放教案是内部资料存档的成功案例,此外莫尼黑大学的基因GeneCenter 数据库已经广为生命科学研究人员认可[15]。

  2.3 异构资源互联

  大多研究型机构都有自己的网站、情报系统(图书馆)、邮件系统,有的还有办公平台、ERP等,但这些系统大多为不同公司产品,彼此之间独立。此外大多属机构都购买了很多知识服务和产品。

  机构知识库一个很重要的功能就是把机构内的 “信息孤岛”联通起来,把不同来源的文献进行有机的融合、沉淀、梳理、分类,形成一个机构知识库,集中展现、搜索、使用。

  在进行这些异构资源整合时,希望原系统开发厂家来提供统一资源接口,往往仅是美好“愿望”,可操作的办法就是使用搜索引擎技术,把所有资源进行某种形式的“收割”。

  异构资源互通,应该以不影响原有系统的使用为原则。如果能提供一些插件,如IE中的搜索插件,在实现资源互通外,还能改善原来系统的功能。

  资源互通,应以提供便捷的搜索接口,如Google那样的便捷搜索和高级搜索为使用目标。考虑到大型研究机构往往需要图书馆借阅系统相关联,因此还应该在“快照”中辅之其它有价值信息,如是否可供借阅等。

  2.4 成员资源集聚

  大多机构成员都收藏了一些工作有关的文献。把机构成员个人资源进行汇集、梳理、分享,并为成员提供“资源备份”功能,可作为机构知识库一个的辅助功能。

  1) 成员收藏文献中,有的来源于机构购买的数据库,很多则是机构成员通过其他渠道收集的,这些资源可以丰富机构知识库。

  2) 成员收藏文献过程就是一个文献甄选过程,成员收藏文献大多是价值度高、和机构研究方向密切相关的文献。

  成员收藏文献整合中需要注意的问题:

  1) 版权问题。成员收藏的文献,大多不是机构成员发表的文献,机构可能没有这些文献的传播权,因此只能内部使用,或者团队内使用,切忌对社会公开。换一种思路和视角, “整合、收割”可以认为是为机构用户提供的一种“文献代存、备份”的技术服务。

  2) 知情原则。整合机构成员手中文献,要让成员知情,明示自动收割文献的范围,以及不愿意“自动备份”文献的处理方法。切忌在不告知的情况下,收割成员文献,这将引起机构成员的“抵触”甚至“敌意”。

  3) 尊重成员意愿,给成员选择权。成员收集、撰写的某些文献不一定愿意公开分享,或者只愿意在自己设定的范围内分享,甚至不分享,成员的这些权利要得到尊重。

  2.5 知识再组织

  一篇文献或一部论著中,有价值的往往仅仅是其中的一部分。打个比喻就是:人类的知识就像一粒粒的“珍珠”,掩藏于文献的“蚌壳儿”中。目前的搜索引擎能帮助找到可能包含需要知识珍珠的“蚌体”,但里面是否有需要的知识,掰开“蚌壳”以后才能知道,而且要花费力气去发现珍珠。如果能把“蚌壳”掰开,摘出珍珠,并串成珍珠项链,那将节省大量的时间,使得知识获取变得更加高效、容易。

  知识再组织将改变图书馆目前主要的“Buyer”角色,给机构的图书馆、情报系统带来角色的升华,使其成为知识再组织的参与者和服务提供平台。

  知识再组织,将为机构提供一个全新的平台,使其成为人类知识树上的某些节点的组织者,通过这些知识节点的组织,机构将赢得关注,提高影响力。

  3 机构知识库功能的“服务”属性

  机构知识库作为研究型机构的一种基础建设,最原始功能应该是为机构成员的科研和学习提供服务。但目前大多机构的图书馆和情报部门,其功能已经简化为资源购买和自习场所提供。

  3.1 科研助理

  大多科研人员,都希望拥有一个科研助理,来帮助收集、记录、提醒、处理一些信息和事务。

  对于机构成员个人而言,机构知识库的科研、学习服务功能可以概括为:知识获取、知识管理和知识应用。

  3.1.1 知识获取

  知识获取,就是及时获取自己感兴趣的各种资讯,包括最新文章、专利、会议通知、基金申报信息、最新产品等。知识获取分为积累性知识获取和积累性知识获取。

  1) 目标性知识获取:目标性知识获取就是为了某一项目、某一任务,需要在短时间内获取到相关的信息。目标性知识获取的最有效方案为搜索。目前大多数的数据库都提供丰富的搜索功能,但遗憾的,某个技术人员需要的文献分散在众多的数据库中,需要在众多的数据库中,如SCI、Springer、Elsevier、IEEE,Pubmed、知网、万方、专利数据库等,逐个搜索。提供到众多专业数据库“一站式”搜索的“元搜索”将成为未来科技搜索的方向。

  2) 积累性知识获取:积累性知识获取没有特别强的目的性,是为了知识积累而进行的知识获取。积累性知识获取的最佳方式为订阅,新兴起的微博也正在以一种新型的订阅改变着“订阅”的习惯。订阅不不仅仅包括纯专业资讯,也包括基金项目申报、学术会议等信息。

  3.1.2 知识管理

  知识管理的核心功能就是把收集到信息进行分类、标记等,提高效率。具体为:

  文献

  文献和文件、文稿的区别在于,文献的内涵不仅仅包括全文文件,更重要的是包括相关的元数据。如一篇期刊文章的元数据包括标题、作者、发表期刊,年卷期,页码,摘要,关键词,DOI、甚至包括参考文献。文献管理的主要功能,就是支持能从主流数据库中,把读者关注的文献方便导入到个人知识库中,而不用通过复制、粘贴繁琐的操作。

  目前很多研究人员都在使用专业的参考文献管理软件,如EndNote,Mendeley, NoteExpress,NoteFirst[16],这说明研究人员需要这样的服务。

  文稿和文件

  文稿就是用户自己撰写的各种文档。文稿中最有价值的一种应用就是试验记录。

  文稿管理的主要功能就是文稿模板提供、文稿审阅、版本记录、分类标引和快速定位。

  目前一些国家重点实验室在使用北京库巴扎的E3-Lab[17]试验记录平台,说明了包括实验记录在内的文稿管理是研究人员需要的一种服务。

  网页和知识卡片

  随着博客、仓储的发展,互联网上存在很多有价值的知识,这些网页、网页中精华内容的快捷保存也逐渐成为知识管理的重要组成部分,研究人员需要把把有价值的网页进行快捷保存,并把保存的网页制作成电子书。

  3.1.3 知识应用

  目前知识应用的突出代表就是“写作助手”和“发表”。

  ?写作助手

  参考文献管理软件的一个主要功能就是写作时,根据不同期刊、出版社对参考文献的规定,自动形成规范的参考文献。这个功能对于需要猎取上百篇参考文献的博士、硕士学位论文作者来讲,是一项非常具有实用价值的功能。

  发表

  “发表”包括在公开出版出版物,如期刊、学术会议上发表,也包括在一些仓储上进行存档。机构知识库也是一种存档形式。

  此外,知识进行关联,分享等也是一种知识应用。

  3.2 团队协作

  目前的科研已经进入了团队协作时代。在一个机构内,往往有很多研究团队(如研究室、研究组、课题组等)。大学和研究所中,一个导师就带领一个团队。

  团队协作应具有的功能包括:

  团队成员中资源的分享、积累和传承

  机构成员中大多每人都收集了很多文献,完成了很多实验记录,撰写过论文和报告,这些资源不应该随着学生的毕业离校、成员的岗位调动而流失,需要把散存在机构成员中的有价值资源变成团队的积累。

  文稿共同撰写和评阅

  一些报告需要多人合作完成,还要经过导师和团队负责人的评阅。这些评阅、修改记录也是团队的一种财富,机构成员通过批注来学习其他人的视角和考虑问题的思路,还可通过版本记录来分体味脉络。

  交流

  成员之间的交流,团队公告、通知、任务安排等。

  QQ群具备团队写作的雏形功能,但仅仅提供了文件分享功能,尚不提供文献分享、知识卡片分享、文稿评议和共同撰写功能。此外QQ群的数据,机构无法控制,对安全性存在顾虑。

  目前NoteFirst、Mendeley、EndNote已经具备了其中文献资源分享功能,NoteFirst 2.0还提供网页和知识卡片的分享功能,北京库巴扎的E3-Lab专用于团队的实验记录分享。

  3.3 科学社区-跟随性阅读

  “新浪”微博和“人人网”社交网络,目前风生水起,究其原因就是满足了“社交”功能。虽然,目前“微博”的用户人数正在迅速扩大,但微博中大多为非科技资讯,尚无法满足科研人员的特殊需要。科研人员希望科学社区的功能包括:

     结识同行

  最好不要局限于同一机构,最好不要限于相同资深程度。

  讨论共同感兴趣的话题

  跟随性阅读

  如果某个资深专家愿意把阅读过的文献、订阅的期刊,作为一种信息分享给关注者,关注者即可沿着专家的足迹前进,事半功倍。这种获取知识的方式可称之为“跟随性阅读”。

  目前基于文献的社区已经得到了主流数据商的支持,NPG集团推出了connatea[18],Springer推出了CiteUlike[19],德国的researchgate[20]已经得到了德国马普学会的支持。

  4 个人成果自动收集

  机构知识库建设中的主要“瓶颈”就是机构成员成果的收集和确认,NoteFirst提供个人成果收集工具,其重要作用就是帮助成员自动收集个人知识成果,再经过成员人工确认,确认后的个人成果可通过OAI接口导出,或者被机构知识库自动收割。

  其核心思想是利用数据库提供的高级检索功能,到多个数据库去查询指定机构的作者的文献。要求同时输入姓名和机构,机构和命名之前关系为“与”,以保证检索结果的精确性;机构、作者的中英文及其变种之间的操作为“或”或关系,以提高检索结果的全面性。图2是NoteFirst的个人知识成果收集窗体。

  图2 NoteFIrst的个人成果收集窗体

  检索结果被转换为RSS,作者通过RSS订阅来及时收集到个人成果。

  其中支持的来源数据库种类决定了输出结果的全面性,目前NoteFirst支持知网、万方、国家图书馆、SCI、EI、SSCI、ISTP、Pubmed、Springer、ScienceDirect、NPG(Nature Publishing Group)、Wiley等主要数据库。

  遗憾的是无法区分同机构同姓名的作者,因此必须引入人工审核机制。

  5 结束语

  机构知识库,要想得到可持续发展,需要兼顾功能的“机构”属性和“服务”属性,不可偏颇。最好分阶段实施,能在接受时限内,取得一定的效果,引起社会各界的继续支持。在以上列举的功能中,公开成果库、过程文献库、异构资源互通、科研秘书、团队协作可以在第一阶段实施,而成员文献集聚、知识再组织、科学社区可后期实施。

  机构知识库最原始的功能是机构公开成果库,也是机构知识库发展的初级阶段,但如果机构知识库止步于机构公开成果库,就可能让有发展潜力的机构知识库沦为“鸡肋”。

  另外之前的大多机构知识库中的文献来源是通过成员人工提交,在机构知识库建设过程中,机构成员是承担了义务,而没有获得更多有实用价值的服务,机构知识库是“剃头挑子一头热”。如果能让机构成员在享受到需要的服务的同时,而又不需要付出太多劳动,实现机构知识的自动集聚,那无疑将解决机构知识库建设的“最后一公里”瓶颈。

  参考文献

  [1] 厦门大学图书馆.厦门大学学术典藏库[EB/OL].[2011-08-21]. http://dspace.xmu.edu.cn/dspace/.

  [2] 中国科学院国科图书馆.中国科学院国家科学图书馆机构知识库[EB/OL].[2011-01-23]. http://ir.las.ac.cn/.

  [3] 金春梅.近五年来我国机构知识库研究综述[J].图书馆学刊,2008(6):8-10.

  [4] LYNCH C A. Institutional repositories: essential infrastructure for scholarship in the digital age,ARL, no. 226[R/OL], 2003: 1-7.

  [5] CROW R. The case for institutional repositories: a sparc position paper[EB/OL]. [2011-08-22]. http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf.

  [6] 北京分形科技有限公司.中国开放教育资源联合体[EB/OL].[2011-02-27]. http://www.core.org.cn/.

  [7] 佚名.2006国际数学家大会:菲尔茨奖花落四家[EB/OL].[2011-08-23]. http://news.xinhuanet.com/tech/2006-08/22/content_4994657.htm.

  [8] Stanford University Libraries. Highwire[EB/OL]. [2011-02-27]. http://highwire.stanford.edu/.

  [9] Lund University Libraries. Directory of open access journals[EB/OL]. [2011-01-08]. http://www.doaj.org/.

  [10] University of Nottingham. The directory of open access repositories - opendoar[EB/OL]. [2011-01-23]. http://www.opendoar.org/index.html.

  [11] BUEHLER A M, BOATENG A. The evolving impact of institutional repositories on reference librarians[J/OL]. Reference Services Review, 2005, 33(2): 291-300.

  [12] 韩珂,祝忠明.科研机构对机构知识仓储认知和服务需求调查分析[J/OL].现代图书情报技术,2008(3):12-17.

  [13] 中国科学院国家科学图书馆.机构知识库[EB/OL].[2011-08-23]. http://www.las.cas.cn/kycg/jgzsk/.

  [14] EYSENBACH G. Citation advantage of open access articles[J]. PLOS Biology, 2006, 4(5): 692-698.

  [15] The Gene Center of the University of Munich. Gene center munich[EB/OL]. [2011-08-21]. http://www.lmb.uni-muenchen.de/.

  [16] 西安知先信息技术有限公司.NoteFirst网络版参考文献管理软件[EB/OL].[2011-02-27]. http://www.notefirst.com.

  [17] 北京库巴扎信息科技有限公司.E3-Lab电子实验记录系统[EB/OL].[2011-08-21]. http://www.cobazaar.com/.

  [18] Nature Publishing Group. Free online reference management and sharing for researchers and scientists[EB/OL]. [2011-02-27]. http://www.connotea.org/.

  [19] SPRINGER. Citeulike: everyones library[EB/OL]. [2011-02-27]. http://www.citeulike.org/.

  [20] researchgate net. Researchgate is the professional network for scientists[EB/OL]. [2011-02-27]. http://www.researchgate.com/.

  作者简介

  钱建立,男,1964年出生,博士,主要研究方向为开放存取、搜索引擎、元数据抽取和机构知识库,《电子设计工程》主编,西安知先信息技术有限公司http://npuweb.notefirst.com/   http://teamplat.notefirst.com/)总经理,中国科技期刊编辑学会数字出版和发展专业委员会副主任,Email:Jack.qian@notefirst.com ;李鹏,男,1979年出生,陕西省科学技术信息研究所助理研究员,研究方向为科技成果管理与评估;李若溪,女,1959年出生,编审,重庆师范大学学报编辑部主任,中国高校科技期刊研究会学术工作委员会主任,研究方向为开放存取。

  论文基金情况

  国家社会科学基金,项目名称:开放获取(OA)学术资源分布和集成形式分类与可持续发展研究,项目编号:10XTQ007。

  教育部人文社科研究规划基金项目“网络学术资源分布和集成现状与传播效率研究”,项目编号:10YJA860011。

  文章发表于:《情报杂志》2012年No:11

点击进入西安知先信息技术有限公司展台查看更多 来源:教育装备采购网 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

校体购产品