ホーム

メンバー | 事業推進担当者

丸山 修

メンバー

拠点リーダーメッセージ ダウンロード 産業技術数理コンソーシアム

メンバー

事業推進担当者

計算生物学(computational biology)

丸山 修(システム生命科学府)
学位:博士(理学)(九州大学)
専門分野:アルゴリズムとバイオインフォマティクス
ユニット:数と式

活動報告書

図1

現在の生命や生物に関する科学分野の特徴の一つは、産業とのつながりが以前より強くなっていることであり、この傾向はさらに強まりつつあることです。例えば、生命科学研究の応用先として、創薬、医療、機能性食品、微生物による資材生産、バイオマス燃料、DNA鑑定などの認証技術、タンパク質を用いたエンジニアリング等々様々な産業分野やビジネスが挙げられます。

このような中、私が行ってきた研究は、バイオインフォマティクス分野における配列解析を中心とした生物学的知識発見の手法やアルゴリズムの開発といった理論と応用の両方における研究です。特に、なんらかの共通の性質をもつと予測された生物学的配列データ(DNA配列やタンパク質配列)からそれらを特徴づける配列パターンを抽出する問題を中心に研究を展開してきました。DNA配列は暗号化された生命の設計図であり、この設計図に基づき作られるタンパク質はそれぞれに特命を担った分子です。このような配列データを解析しその機能を理解することは、生命のパーツを理解する上で不可欠なことです。

タンパク質の多くは、他のタンパク質と相互に結合することにより、その機能を発揮します(図1参照)。従って、これらの相互作用の機構等を理解することは、薬の設計等において重要な示唆を与えることになります。そこで、タンパク質Aはタンパク質B1,…,Bnは相互作用するという入力情報から、B1,…,Bnのアミノ酸配列が共通に含む特徴的な配列を抽出することにより、Aとの相互作用に何らかの形で深く関与する(その多くは直接Aとコンタクトする)部分配列を予測する手法を開発しています。この研究の成果として、いくつかのタンパク質に対して、信頼度の高い相互作用部位の特定に成功しています。

図2

タンパク質がDNAから合成される過程を遺伝子発現と言いますが、この過程の最初の重要なステップがDNAの情報がメッセンジャーRNAにコピーされる「転写」という現象です(図2参照)。では、この「転写」がどうしたら始まるかと言うと、転写因子とよばれるタンパク質の複合体が、遺伝子配列の上流領域の特定のサイトへ結合することにより、その遺伝子の転写のスイッチが「入り」になるのです。それ故、各転写因子が結合するサイトの文字列パターンを明らかにすることは、遺伝子間の制御構造に関して重要かつ基礎的な知見を与えることが期待できます。従来手法の枠組みでは、マイクロアレー等の結果により、共通の転写因子から制御をおそらく受けていると考えられる遺伝子群の上流領域から、特徴的な文字列パターンを結合部位として予測します。パターンの評価関数としては、統計的な指標などがよく用いられます。近年、様々の生物種の配列が決定されたことにより、近種の生物種の相同配列間で比較を行い、周辺配列と比較してよく保存されている領域を機能領域として予測する手法である「系統的フットプリンティング」が注目されています。この手法に基づく新しいアルゴリズムを提案しています。このアルゴリズムの特徴として、2種類の評価関数(サイト・アライメントに対する、最節約スコアと進化確率モデルに基づく対数尤度スコア)を用いることがあげられます。これにより、検索空間を絞り込むと同時に、解の質を向上させることに成功しています。

RETURN LIST