23AndMeなどは個人を対象に遺伝子検査を実施していますが、より広い集団で共通する遺伝情報がわかれば、健康および疾患に関する理解が進むでしょう。
南カリフォルニア大学ビタビ工学部(USC Viterbi)らの研究チームは、「iLASH(IBD by LocAlity-Sensitive Hashing)」と呼ばれる手法により、遺伝子のなつながりを見つけるプロセスを効率化しています。
研究チームが進めるのは遺伝子疾患に焦点を当てたプロジェクトですが、iLASHは遠い親戚を見つけるといった目的にも使用できるようです。
これまでにないスケーラビリティと精度を実現iLASHは、遺伝子データセット内で個人間のDNAの共通部分とその量を調べる「IDB推定」がベースになっています。「局所性鋭敏型ハッシュ(LSH)」と呼ばれる確率的処理により分析を高速化。関連しない遺伝子のペアを排除し、関連の可能性が高いペアのみを残します。
また、複数のプロセスを同時に実行できる並列コンピューティングを用いて、IBD推定を効率的に実行。これらを組み合わせることで、従来1週間かかっていた5万人ぶんのデータセットを1時間で分析できるようです。
iLASHの突出したスケーラビリティと精度のおかげで、これまでは見つけられなかった遺伝子のつながりが示せる可能性があります。
集団遺伝学と個別化医療どちらにも貢献集団遺伝学の分野では、すでにiLASHが世界の研究者によって実装されていて、たとえばマウントサイナイ医科大学の研究者は、iLASHを用いてイギリス人50万人の遺伝子データセット、UKバイオバンクの分析を実施しました。
個別化医療の分野では、希少疾患遺伝子の起源の研究や、遺伝学の多様性についての理解を深めるためのツールとしてiLASHが有望視されています。
今後研究チームは、スケーラビリティ増大に備えてiLASHの分散バージョンを開発していく計画。iLASHのクラウドサービスの構築も検討していますが、機密性の高い遺伝子データを扱うことになるため、倫理上/セキュリティ上の課題を解決する必要があるようです。
参照元:Find Your Genetic Relatives Quickly and Accurately with USC ISI’s iLASH Algorithm/ USC Viterbi
(文・山田洋路)