QIIME 2教程. 10數據導出Exporting data(2020.2)

前情提要

  • NBT:QIIME 2可重複、交互式的微生物組分析平臺

  • 1簡介和安裝Introduction&Install

  • 2插件工作流程概述Workflow

  • 3老司機上路指南Experienced

  • 4人體各部位微生物組分析Moving Pictures,Genome Biology:人體各部位微生物組時間序列分析

  • 5糞菌移植分析練習FMT,Microbiome:糞菌移植改善自閉症

  • 6沙漠土壤分析Atacama soil,mSystems:乾旱對土壤微生物組的影響

  • 7帕金森小鼠教程Parkinson’s Mouse,Cell:腸道菌群促進帕金森發生ParkinsonDisease

  • 8差異丰度分析gneiss

  • 9數據導入Importing data

QIIME 2用戶文檔. 10數據導出

https://docs.qiime2.org/2020.2/tutorials/exporting/

Exporting data

注:最好按本教程順序學習,想直接學習本章,至少完成本系列1簡介和安裝。

為了使用QIIME 2,輸入數據必須存儲在QIIME 2對象(即<code>qza/<code>文件)中。這是支持分佈式、自動來源跟蹤、語義類型驗證和數據格式之間的轉換的基礎(有關QIIME 2對象的更多詳細信息,請參閱核心概念頁)。

有時,您需要從QIIME 2對象中導出數據,例如使用不同的微生物組分析程序分析數據,或在R中進行統計分析。這可以通過使用<code>qiime tools export/<code>命令來實現,該命令以QIIME 2對象(.qza)文件和輸出目錄作為輸入。對象中的數據將根據特定對象導出一個或多個文件。

注意: 當從QIIME 2對象導出數據時,將不再有與數據相關的來源。如果隨後重新導入數據,則與新對象關聯的源將從導入步驟開始,並且所有現有的來源信息都將丟失。因此,最好只在使用QIIME 2完成所有可以實現的處理步驟後,再從對象中導出數據,以最大化每個對象的來源追溯。

以下部分提供了從QIIME 2對象導出數據的示例。可以從任何QIIME 2對象或可視化中導出數據;該過程與下面描述的過程相同。

詳者注:為什麼要導出文件?

QIIME2採用統一<code>qza/<code>文件格式,是為了保證文件格式統一和分析流程可追溯。但不可能要求每個人都用此需系統,而且此係統的功能也不是萬能的,需要導出其它軟件兼容的格式,方便交流和其它用戶開展個性化的分析。

啟動工作環境並創建工作目錄

<code>

定義工作目錄變量,方便以後多次使用


wd=~/github/QIIME2ChineseManual/2020.2


mkdir -p

$wd

















/<code>

導出特徵表

Exporting a feature table

導出<code>FeatureTable[Frequency]/<code>對象為BIOM v2.1格式

<code>

wget

\
-O

"feature-table.qza"

\

"https://data.qiime2.org/2020.2/tutorials/exporting/feature-table.qza"






/<code>
  • <code>feature-table.qza/<code>:

    QIIME 2特徵表文件。

    查看 | 下載

詳者注

導出的biom文件位於<code>exported-feature-table/<code>文件夾中,名為feature-table.biom,可用biom程序對文件進行格式轉換和分析,可參閱以下教程:

  • BIOM:生物觀測矩陣——微生物組數據通用數據格式

BIOM 2.1格式也是HDF5格式,為二進制,無法直接查看,必須轉換為文本閱讀。

biom轉換biom為tsv格式

<code>biom convert -i exported-feature-

table

/feature-

table

.biom \
-o exported-feature-

table

/feature-

table

.txt \
/<code>

查看文件<code>less -S exported-feature-table/feature-table.txt/<code>

<code># 

Constructed

from

biom

file


#OTU

ID

K3

.H

K3

.Z

M2

.Middle

.L

K3

.A

K3

.R

K3

.V


New

.CleanUp

.ReferenceOTU0

2

.0

0

.0

0

.0

0

.0


New

.CleanUp

.ReferenceOTU1

0

.0

1

.0

6

.0

1

.0


New

.CleanUp

.ReferenceOTU3

0

.0

0

.0

0

.0

0

.0


/<code>

同理tsv轉換為biom的代碼如下:

<code>biom convert -i exported-feature-

table

/feature-

table

.txt \
-o

table

.from_txt_hdf5.biom \
/<code>

導出進化樹

Exporting a phylogenetic tree

導出<code>Phylogeny[Unrooted]/<code>對象為newick格式

<code>wget \
-O

"unrooted-tree.qza"

\

"https://data.qiime2.org/2020.2/tutorials/exporting/unrooted-tree.qza"



qiime tools

export

\
--input-path unrooted-tree.qza \
--output-path exported-tree/<code>
  • <code>unrooted-tree.qza/<code>:

    無根樹文件。

    查看 | 下載

導文件為<code>exported-tree/tree.nwk/<code>,是標準樹nwk文件

<code>(((

New

.CleanUp

.ReferenceOTU1480

:0.11995

,(

New

.CleanUp

.ReferenceOTU202

:0.04479

,

New

.CleanUp

.ReferenceOTU432

:0.0049)0.769

:0.04661)1

:0.26705

,
((

New

.CleanUp

.ReferenceOTU1150

:0.00016

,(

New

.CleanUp

.ReferenceOTU782

:0.04264

,(

New

.CleanUp

.ReferenceOTU643

:0.10438

,
(((

New

.CleanUp

.ReferenceOTU1014

:0.01521

,

New

.CleanUp

.ReferenceOTU270

:0.02738)0.879

:0.02315

,(((

New

.CleanUp

.ReferenceOTU1008

:0.0378

/<code>

導出與提取

Exporting versus extracting

提取包括所有的信息文件,如下例中的特徵表文件,結果即包括特徵表,又包括生成此文件的相關軟件版本信息,還有生成此文件所有步驟的文件說明。

<code>

mkdir

-p

extracted-feature-table


qiime

tools

extract

\

--input-path

feature-table

.qza

\

--output-path

extracted-feature-table

/<code>

解壓/提取目錄包括一個對象編號UUID的目錄,裡面有所有文件。

推薦使用 https://view.qiime2.org 在線查看結果,可以圖形化展示分析流程的追溯。

https://docs.qiime2.org/2020.2/

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley,Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2.Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

譯者簡介

劉永鑫,博士。2008年畢業於東北農大微生物學,2014年於中科院遺傳發育所獲生物信息學博士,2016年遺傳學博士後出站留所工作,任宏基因組學實驗室工程師。目前主要研究方向為宏基因組數據分析和植物微生物組,QIIME 2項目參與人。目前在Science、Nature Biotechnology、Cell Host & Microbe、Current Opinion in Microbiology等雜誌發表論文20+篇。2017年7月創辦“宏基因組”公眾號,目前分享宏基因組、擴增子原創文章500餘篇,代表博文有《擴增子圖表解讀、分析流程和統計繪圖三部曲(21篇)》、《Nature綜述:手把手教你分析菌群數據(1.8萬字)》、《QIIME2中文教程(22篇)》等,關注人數8萬+,累計閱讀1200萬+。

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人


分享到:


相關文章: