Aritalab:Lecture/Programming/Unix
From Metabolomics.JP
Wiki Top | Up one level | レポートの書き方 | Arita Laboratory |
|
Windows・MacでUnix環境を使う
Mac は Unix ライクなコンソールを備えていますが、Windowsは Ubuntu (LinuxOSの一種)をインストールする必要があります。 まず以下のサイトのとおりに、Windows 上に WSL をインストールします。これで Ubuntu のコンソールを使えるようになります。
- [1]
次に miniconda というパッケージマネジャーをインストールします。Minicondaは様々なソフトウェアを Linux 上に導入する conda パッケージの最小版になります。
- [2]
Windows用の .exe ファイルをインストールすると windows powershell 用に環境が整ってしまいます。WSLで導入した Ubuntu から実行するには以下のようにします。
> curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh ... > bash Miniconda3-latest-Linux-x86_64.sh ...
これで miniconda が入ります。
Unixコマンドの基本
コマンドのオプションや詳細は、"man コマンド名"や"コマンド名 --help"と打って調べましょう。
|
|
|
ゲノム解析に必要なツールとデータ
conda を使って以下のように準備しておきます。
(base) $ conda install -y -c bioconda fastqc fastp megahit seqkit ... (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 6/DRR024501_1.fastq.bz2 (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 6/DRR024501_2.fastq.bz2 ... (base) $ bunzip2 *.bz2 ... >seqkit stats *.fastq (base) $ seqkit stats *.fastq file format type num_seqs sum_len min_len avg_len max_len DRR024501_1.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251 DRR024501_2.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251