【流式数据共享】在线存储库

1 简介

科学研究比以往任何时候都更需要数据密集和协作。带有批注的数据的透明性和公共可用性对于独立验证,确认以及从以前的结果扩展研究至关重要。因此,国家政策,国际监管机构,科学期刊以及研究资助机构越来越要求提供原始数据。

在基于荧光和质谱的流式细胞术中,原始数据通常由FCS文件表示,其中包含仪器分析的所有颗粒(细胞)的所有测量“通道”(特征)表达值的矩阵(表) 。这些文件应根据适用的特定领域的准则进行正确注释。在流式细胞术中,此类指导原则由有关流式细胞术实验的最低信息表示。此外,应检查biosharing.org网站(MIBBI项目)是否有适用的其他要求。

2 公共存仓库

建议将数据存储在公共存储库中以共享。下面介绍了四个适用于流式数据的公共存储库:Cytobank(http://www.cytobank.org/)、FlowRepository(https://flowrepository.org/)、ImmPort( https://immport.niaid.nih.gov)和ImmuneSpace(https://www.immunespace.org/)。表16提供了具有技术注释和突出显示的功能的概述。

表16. 流式数据存储库概览

【流式数据共享】在线存储库


2.1 Cytobank

是由Cytobank Incorporated开发和托管的在线数据分析和管理平台。Cytobank的社区版本提供免费功能,包括Web访问,数据存储,实验共享和基本的在线分析。Cytobank的社区版本包含来自大约60个不同作者的近400个公共实验(数据集)。此外,Cytobank还提供带高级数据分析选项(包括SPADE和viSNE),更好的客户支持和专用计算资源的付费高级版和企业版。如果您的实验室已经在使用Cytobank,则选择其社区版本将提供一个公开共享数据的简单选择。所有版本的Cytobank也可以实现只与合作者私下共享数据。

2.2 FlowRepository

是一个公共存储库,允许研究人员存储、注释、分析、共享和发布流式数据,主要是与经过同行评审的手稿有关的数据。该储存库由国际细胞计量学学会(ISAC)免费提供。虽然FlowRepository是通过扩展Cytobank的代码库而开发的,但在过去的5年中,这两个平台通过添加不同的功能而差异化。但是,仍有许多共同的方面允许一个系统的用户轻松地适应另一个系统。Cytobank的平台提供了更高级的数据分析选项,而FlowRepository专注于数据共享和注释,包括对MIFlowCyt的全面支持。此外,FlowRepository与几种科学期刊紧密合作,并允许将数据与相关出版物链接起来。汤森路透(Thomson Reuters)和FlowRepository的数据引文索引(Data Citation Index)界面的合作可帮助研究人员获得适当的信用数据。与大多数其他存储库不同,用户无需注册即可从FlowRepository下载公共数据。他们可以使用基于Web的界面匿名进行操作,也可以使用FlowRepositoryR BioConductor库从R统计语言内部进行操作,也可以使用FlowRepositoryServer插件从FlowJo内部进行操作。目前,FlowRepository包含来自1,200位科学家的1,000多个数据集,并链接到30种不同期刊上的论文。目前有一半的数据集是公开的,其余的大多数数据与正在进行的研究有关,其中基础数据将与研究结果的发布一起发布。Nature,Cytometry A部分和PLOS期刊建议将数据存储到FlowRepository。

2.3 ImmPort

免疫学数据库和分析门户(ImmPort)系统提供了由研究人员生成的免疫学研究数据的档案库,这些研究人员主要来自美国国立卫生研究院(NIH),美国国家过敏和传染病研究所(NIAID),过敏、免疫学和移植科(DAIT)。它是一个广泛的数据仓库,包含由数十种测定类型产生的实验和临床试验数据的集成,包括63种流式细胞术和5种CyTOF数据集。此外,ImmPort系统还提供数据分析工具,并以近50种模板的形式包含用于临床和基因组研究的隐性知识和“最佳实践”,以用于数据沉积,管理和传播。ImmPort是由Northrop Grumman信息技术健康解决方案团队根据生物信息学集成支持合同(BISC)为NIH NIAID/DAIT开发的。如果您的研究经费来自该来源,并且您正在生成免疫学数据,则应将其保存在ImmPort中。如果要生成流式数据的同时还有来自不同类型化验的数据,Immport对不同数据类型的支持可能是选择它的另一个原因。为了在ImmPort上存放和访问数据,需要DAIT的(免费)注册和批准。

2.4 ImmuneSpace

是一个数据库和分析引擎,通过为人类免疫项目联合会(HIPC)定制LabKey服务器而构建。ImmuneSpace可用于查找和探索研究,整合和分析所有试验中的数据,以及直接在R内部执行自定义分析。ImmmmuneSpace利用了ImmPort的基础架构,在许多情况下,ImmuneSpace提供了新的界面和新的补充。目前,ImmuneSpace正用于访问12个大型HIPC研究(741个参与者)的流式数据,和4个HIPC研究的CYTOF数据。典型的数据提交工作流程包括使用一组标准化数据模板将数据提交到ImmPort。如是HIPC参与者,数据应存放在ImmuneSpace;或者也可以将ImmuneSpace用作HIPC数据和分析工具的宝贵资源。

3 临床数据

对于临床来源的数据,需要注意的是在共享之前,需要进行去身份化操作,以删除用于识别个人的标识符包括患者姓名、保险号、公共ID号、出生日期等,以满足各国的隐私保护法规。FlowRepository提供了去身份化功能,快速入门指南请参考:http://flowrepository.org/quick_start_guide。

Reference:

Guidelines for the use of flow cytometry and cell sorting in immunological studies

以上内容若有不妥敬请指正。

向所有一线抗疫勇士致敬!

微信号 : FACSinformation


分享到:


相關文章: