User:Aritalab/Topics

From Metabolomics.JP
Jump to: navigation, search

Contents

代謝のバイオインフォマティクス

有田研究室では「代謝」の情報科学的研究をおこなっています。代謝とは細胞内の物理化学反応の全体を指す言葉で、一般には新陳代謝などともいわれます。 ヒトは必須アミノ酸を含め多くの化合物を食事として摂取・利用しますが、植物や菌類には必要な栄養素をほぼ全て自前で生合成できる種もあります。そうした生物種ごとの違いや進化的な関係を、遺伝子情報・代謝物情報などを駆使して明らかにすることが目標です。

現在おこなっている研究

代謝ネットワークの数理

遺伝子配列に比較して、代謝ネットワークは環境との相互作用が大きく反映されると考えられます。 代謝ネットワークの比較と分子系統樹(遺伝子の比較)を相補的に用いて、植物や共生細菌の進化を解明しようとしています。

主な成果
  • 生態系ネットワークが入れ子構造をつくる理由[1]
  • 代謝ネットワーク比較による寄生生物の検出[2]

ゆらぎと生命

従来「ノイズ」と称されて有害扱いされてきた入力のゆらぎは、生命現象にとって有害どころか有用であることが最近わかりつつあります。特任助教の長谷川さんがこの分野に精通しています。

主な成果
  • 遺伝子のスイッチングにはゆらぎが必要 [3]

代謝物のデータベース

Metabolomics.JP

あなたが見ているウェブサイトは Metabolomics.JP 上に構築されています。このサイトには (トップページからも辿れますが)

などの情報を集積し、相互にリンクしています。

詳しく知りたい方へ
  • ウィキを使ったデータベース構築[4]

マススペクトルのデータベース

日本質量分析学会の公式データベースになった MassBank データベース の開発をおこなっています。

成果
  • MassBankにおける質量スペクトル比較のアルゴリズム [5]
  • MassBankのコンセプト [6]
References
  1. Takemoto K, Arita M "Nested structure acquired through simple evolutionary process" Journal of Theoretical Biology 264(3), 782-786, 2010
  2. Chang CW, Lyu PC, Arita M "Reconstructing phylogeny from metabolic substrate-product relationships" BMC Bioinformatics (Proceedings 9th APBC in Korea) 12(Suppl 1):S27, 2011
  3. Hasegawa Y, Arita M "Noise-intensity fluctuation in Langevin model and its higher-order Fokker–Planck equation" Physica A 390(6) 1051-1063, 2011
  4. Arita M, Suwa K "Search extension transforms Wiki into a relational system: a case for flavonoid metabolite database" BMC BioData Mining 1:7, 2008
  5. Horai H, Arita M, Nishioka T "Comparison of ESI-MS Spectra in MassBank Database" Proceedings of the International Conference on BioMedical Engineering and Informatics (BMEI2008), Hainan China, 1:853-857, 2008
  6. Horai H, Arita M et al. "MassBank: a public repository for sharing mass spectral data for life sciences" Journal of Mass Spectrometry 45(7), 703-714, 2010

これまでの研究

以下のテーマは辞めたわけではありませんが、研究論文はほとんど執筆していません。

DNAへの情報コーディング

2010年に Craig Venter らは人工細胞を作成したとプレスリリースしました。ただし論文の最後には "We didn't create life from scratch." と書いてあります。実際には細菌 (Mycoplasma mycoides) のゲノム 108万塩基対を人工合成し、別の細菌 (Mycoplasma capricolum) に5年の歳月と40億円の資金で導入したものでしたが、このゲノムには開発者らの名前やE-mailアドレスが署名されています。 この署名はアルファベットや数字をDNA3文字に対応させるという大変原始的なコーディング方法です。Nature誌に高校生の論文として掲載されたもの[1](右図)と同じ発想ですが、書き込む文字列でいかなるDNA配列でも表現できてしまうので読み枠の決定や読み取り用のプライマー設計ができません。

Clellandらによるコーディング。Nature誌より。

この問題を回避するには、いかように組み合わせても 1) 読み取り用のプライマー配列を構成しない、 2) GC含量が極端に偏らない、 3) 制限酵素サイトなど回避したい文字列があればそれを生成しない、ことが保証されたDNAコード文字の設計が必要です。

この問題を理論的に言うと4元アルファベットでのコンマフリー符号設計となります。

詳しく知りたい方へ
  • Arita M "Writing Information Into DNA" In Aspects of Molecular Computing (Jonoska N, Paun G, and Rozenberg G eds.) 手法をわかりやすく書いてあります
  • Arita M "In vivo DNA Memory" In Handbook of Natural Computing (Volume II, Molecular Computation), Springer Verlag, 2011 今年出版予定のハンドブックに執筆しています
テンプレート法の概要
成果
  • テンプレート法と名付けた簡単なアイデアでエンコード用の文字列を設計できることを示しました。[2] pdf
  • タンパク質をコードする領域にコドンの冗長性を利用して情報を書き込む「DNA透かし」を提案しました。[3]
References
  1. Clelland CT, Risca V, Bancroft C (1999) "Hiding messages in DNA microdots" Nature 399(6736):533-4
  2. Arita M, Kobayashi S "DNA sequence design using templates" New Generation Computing 20(3), 263-277, 2002
  3. Arita M, Ohashi Y "Secret signatures inside genomic DNA" Biotechnology Progress 20(5), 1605-1607, 2004
Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox