2024年1月 这项工作根据知识共享署名4.0国际许可证获得许可。 https: / / doi. org / 10.29242 / report. radsmethodology2023 Authors 乔尔·赫恩登杜克大学ORCID:0000-0001-9995-9040 肖娜·泰勒研究图书馆协会ORCID:0000-0002-9842-7867 Alicia Hofelich Mohr明尼苏达大学ORCID: 0000 - 0002 - 7644 - 4105 WendyKozlowski康奈尔大学图书馆ORCID: 0000 - 0001 -6539 - 3798 Jonathan Petters弗吉尼亚理工大学ORCID:0000-0002-0853-5814 詹妮弗·摩尔华盛顿大学圣路易斯ORCID:0000-0001-6628-6820 Jake Carlson大学布法罗分校ORCID:0000-0003-2733-0969 Cynthia Hudson Vitale研究图书馆协会ORCID:0000 - 0001 - 5581 - 5678 丽照哥乔治华盛顿大学ORCID:0009-0005-7862-6016 本材料基于美国国家科学基金会资助编号2135874的工作。 建议引文:Taylor,Shawna,AliciaHofelichMohr,JonathanPetters,JakeCarsron,LizhaoGe,JoelHerndon,WendyKozlowski,JenniferMoore,andCynthiaHudsonVitale.RealitiesofAcademicDataDataSharing(RADS)Initiative:ResearchMet https: / / doi. org / 10.29242 / report. radsmethodology2023. 目录 调查发展:RADS公开访问数据分享和管理活动8 附录A-RADS数据管理和公共访问的共享活动30 Overview 本报告描述了在学术数据共享(RADS)计划的第一阶段进行的研究方法1,由美国国家科学基金会(NSF)资助,从2021年到2023年,应被视为对这项研究产生的额外最终研究报告(白皮书)的补充。作为RADS计划的一部分,机构管理人员和受资助的研究人员于2022年进行了调查,并于2023年就与研究数据共享支持服务和实践相关的详细信息及其相应费用进行了访谈。而协会。 研究图书馆(ARL)是RADS计划的行政之家,这项研究是与以下机构的参与者一起进行的:康奈尔大学,杜克大学,密歇根大学,明尼苏达大学,弗吉尼亚理工大学和圣路易斯华盛顿大学。 简介与研究目的 在过去的10到15年中,联邦政府对资助研究人员分享其研究数据以供公众访问的要求越来越高,特别是自2013年白宫科学和技术政策办公室(OSTP) Holdren备忘录“增加获得联邦资助的科学研究结果”发布以来。2随着需求的增加,许多学术机构已经开发并启动了各种支持服务,以减轻其研究人员在满足这些要求方面的负担。服务通常分散在整个机构中,因此,这些服务的范围以及机构支持这些服务的成本尚未 2021年至2023年进行的RADS倡议第一阶段研究的目标是更好地了解这些活动以及机构和资助研究人员的成本。 本文描述的方法涉及两个研究问题3在RADS计划的第一个研究阶段考虑: 1.研究人员如何决定为什么以及如何共享研究数据?2.该机构实施联邦授权的公共获取研究数据政策的成本是多少? RADS研究是回顾性的,调查了2013年至2022年的数据共享和支持活动,包括调查和采访具有部门/单位支出知识的机构管理人员以及六个参与机构的资助研究人员。各自机构的项目主要研究者(PI)向其机构审查委员会(IRB)提交了研究批准申请。每个机构的IRB批准了该研究或认为其不适用于人类参与者类别。研究小组的以下成员是各自机构的PI和机构IRB联络点。 •JakeCarlson,前密歇根大学深蓝存储库和研究数据服务主任(目前是大学研究、收藏和外展,布法罗大学图书馆,布法罗大学,截至2023年8月)•JoelHerndon,杜克大学大学图书馆数据和可视化科学中心主任•AliciaHofelichMohr,研究支持服务协调员,文科技术和创新服务(LATIS),明尼苏达大学•WendyKozlowski,康奈尔大学图书馆,研究数据和开放奖学金主任•圣路易斯华盛顿大学大学图书馆数据服务主管JenniferMoore•JonathanPetters,副主任,数据管理和管理服务,数据服务,大学图书馆,弗吉尼亚理工大学 研究的目标包括对数据管理和共享活动的机构扫描,为研究人员和管理人员收集有关数据共享活动费用的信息,以及根据定性访谈的数据评估数据管理和共享政策对研究人员和机构的影响。 术语 数据共享 在本报告中,“数据共享”实践可能包括研究人员应要求共享数据,有限访问或受限共享,或在平台上无限制共享并可供任何人使用。尽管RADS研究对公共访问的数据共享感兴趣,但调查中的问题询问了联邦政府资助的研究数据的广泛共享。在最广泛的意义上定义调查中的数据共享是有意的,因为数据共享可能意味着不同的学科和机构角色,从将数据放置在公共存储库到提供对受限存储的访问。 基础设施 本报告中的“基础设施”一词,贯穿我们所有的研究成果,被用作一个单一的术语,涵盖所有 从广义上讲,机构努力支持研究数据共享和管理活动。这包括:技术基础设施(例如机构存储库支持);数据治理,包括数据政策的开发,实施和监督;为加速服务而进行的一次性努力或投资;以及持续的服务运营。人员配置时间和成本虽然对于实施和维护基础架构以及运行服务至关重要,但在我们的分析中被视为一个单独的类别。 调查开发:RADS公共访问数据共享和管理活动 为了调查调查中的数据共享做法,RADS调查小组制定了一份活动清单,这些活动将作为管理和共享数据所涉及的具体行动的共同基础或共享词汇(特别考虑到公共访问数据共享)。4研究小组设计了两个活动清单,其中包括针对研究人员受众的28项活动和针对管理员/研究支持受众的27项活动。受研究和赠款生命周期的影响,这些活动分为五个数据共享生命周期阶段。这两个参与者的完整活动列表在本报告的附录A中列出,以及ARL报告,学术管理和研究人员的公共访问数据管理和共享活动(2022年11月)。 这些活动是与COGR合作开发的,COGR当时正在为其NIH数据管理和共享准备指南制定角色和责任列表。5我们在开发数据共享活动时参考的其他框架包括: •“关注长期数据的成本效益研究,工具和方法”,保持研究数据安全(KRDS),https://beagrie.com/krds。•数据管理成本核算工具和清单,英国数据服务,2022年,https://dam.ukdataservice.ac.uk/media/622368/costingtool.pdf。 •“第2章,框架基础:数据状态和相关活动”,生物医学数据的生命周期决策:预测成本的挑战,美国国家科学,工程和医学研究院的共识研究报告(华盛顿特区:国家科学院出版社,2020年),https://nap.nationalacademiencies.org/read/25639/chapter/4。•管理总成本:档案和特殊收藏中的负责任收藏大楼(俄亥俄州都柏林:OCLCResearch,2021),https://doi.org/10.25333/zbh0-a044。 这些活动用于衡量研究人员和管理人员参与或支持这些行动的程度,以及人员配备和技术基础设施方面的相关成本。 调查方法 行政人员机构基础设施调查 管理员参与者池标识 为了确定调查哪些部门/单位(以下简称“单位”),特别是调查哪些人,每个RADSPI对其机构进行了扫描,以确定支持资助研究人员进行任何数据共享活动的可能单位(在我们的调查开发过程中确定)。除了利用其个人机构知识开始扫描外,PI还与已知的管理员联系,他们的单位支持数据共享,以查询其他可能的办公室,以纳入调查池,并使用机构网站确定要纳入调查池的单位。 在此扫描之后,确定了这些单位的管理员,然后邀请他们参与调查。其他参与纳入标准包括: •了解部门/单位基础设施支出•了解支持数据共享的人员活动•人员工资知识 在六个RADS机构中,参与者池中确定的办公室/管理员的数量各不相同,从15个到34个(表1)。当一个部门下的多个单位的管理员参加时,要求管理员仅报告其单位的活动和支出。对合作单位完成调查的努力没有限制,众所周知,一个单位的多达四个人一起为其单位完成一项调查答复。在这些情况下,调查中只记录了一个管理员姓名。 试点机构基础设施调查 2022年8月,向所有机构的10名试点参与者发送了调查,以获得对调查问题、描述和清晰度的反馈。2022年9月,这些变化被整合到调查中,然后发布到更大的参与者池。试点 参与者被邀请完成调查的最终版本,只有他们对最终版本的回答被纳入分析. 机构基础设施调查发布详细信息 机构基础设施调查(见下文研究工具# 1)于2022年10月3日至2022年12月5日开放, 托管在Alchemer平台上。他们各自机构的RADSPI在调查开始前一周向所有潜在参与者发送了电子邮件,让他们知道调查即将到来,并发送问题的副本,以便他们做好准备。每个RADSPI分别发送调查链接;随后的电子邮件提醒(最多三个)被发送给在整个开放调查期间未回复的管理员。 机构基础设施调查(管理员)回应率 在分析之前,当同一个人不止一次提交调查时,会删除重复的个人回答。当Thisoccurred,themostcompletesurveyresponsewereretained.Additionally,responsesfromadministratorswithinthesameunitwerecollapseintoasingleresponse.Whentherewereresponsesfrommultiplepeopleinthesameunitresponsewascounted.Whentherewerediscrepanciesintheresponsefromthemultiplepeopleinthesameunit,wetooktheresponsefromThemostseniorrespondent.Textfromopen-endedrespondswerecombinedwiththeretainedresponse,whereapplicable.Furthermore,participantsofthepilotsurveywereinvictedtoretakethefinalsurvey 如果他们确实参与,他们的反应会计入总反应率。 删除和折叠重复响应后,各机构管理员的响应率从29.5%到70.6%不等,总体平均响应率为50.0%(见表1)。 表1:应邀完成RADS机构基础设施调查的管理员的响应率注意:表1中反映的响应率是基于清理的数据,其中不包括仅人口统计响应(例如,机构,电子邮件)。 单位分类 认识到机构的行政结构和组织各不相同,答复办公室被归类为四个基于服务的领域之一,以便能够在六个不同机构之间进行比较。这些领域是:图书馆(LIB),中央行政研究办公室(RSCH),信息技术(IT)和学科特定机构或研究中心(IC)。有关所有响应办公室及其基于服务的类别的列表,请参阅附录B。 费用数据清理 在69个回复中,有58个管理员(84%)提供了有关其费用的信息。对费用数据进行了清理,以确保输入回复的一致性(例如整元金额,删除文本和以数字格式输入)。给出范围后,将采用中位数。检查个人回复 确保各问题的答复一致(例如,确保报告的工作人员人数和报告的工资/时间数相匹配)。 如果答复不