■ 研究概要
深層学習を含む近代的なAI技術のほとんどは 機械学習 (Machine Learning) という分野の技術によって支えられています.古典的なAIでは人間が様々な要素を手動で調整してシステムを構築していました.一方,機械学習ではデータから統計的にモデルを推論するデータ駆動 (Data-driven) 型のアプローチを考えます.データ駆動で作られたモデルが,ときに人間が手動で構築したシステムを大きく凌駕するパフォーマンスを達成し得ることが様々な分野で実証され,社会的な関心が高まっています.本研究室では,データ駆動型AI・機械学習が扱う様々なタスクに対して,汎用的な土台となる基礎数理研究と実際のデータ解析応用の両側面から研究に取り組んでいます.
機械学習の基礎方法論研究の例
- 機械学習による知識発見・解釈可能な機械学習モデルに関する研究
機械学習が作る予測モデルの中で何が重要な因子なのかを発見することが様々な場面で重要になっています.例えば遺伝子データ解析において,疾病など興味のある生命現象に対して数万を超える遺伝子や,それらの相互作用から影響力の強いものを見つけ出すような状況が考えられます.また,化合物のような単純な数値で表わしにくい構造を持つデータを考えると,重要な部分構造の発見という問題がより難しくかつ重要になります.このような場合,組み合わせ爆発によって現代の計算機でも愚直な方法では全ての可能性を網羅することは非常に難しくなります.研究室では,複雑な構造を持つデータでも解釈性の高い結果を効率的に提供できる機械学習モデルの研究を行っています.
- ベイズ最適化によるブラックボックス最適化に関する研究
データ駆動的に推定した予測モデルを最適化に用いる技術を研究しています.現実世界の様々な問題が最適化問題として捉えることができます.例えば,次世代の電池材料を設計するためにどのような原子組成のものを用いると電池としてのパフォーマンスが最適化されるのか,あるいは,AIの学習においてどのような設定で学習させると予測精度が最適化されるのかなど幅広い文脈で最適化は現れます.このような問題では特にデータを得ること自体が容易ではない場合も多く少ないデータで如何に効率的に探索を行うかを考える必要があります.研究室ではベイズ的な確率モデルに基づく最適化手法の研究を基礎数理から応用にまたがって様々な観点から研究しています.
- 機械学習の自動化(AutoML)に関する研究
機械学習が様々な問題に適用できることは広く知られて来ましたが,実戦においては職人的なチューニング作業が必要になることも多いです.所与のタスク・データセットに対してどのような機械学習モデルをどのような設定で用いると望ましいパフォーマンスが得られるのか泥臭く手動で調整を行うのは非常にコストが高いです.AutoMLと呼ばれる分野では適切な機械学習の設定を自動的に探索するような方法を考えます.単純に予測精度を向上するだけでなく,如何にして人間の好みを反映するかなど多様な観点での最適化が社会的にも必要とされています.
データ科学の実践例
- 材料情報学に関する研究
望ましい物性を持った新規材料を作成するには多くのコストがかかります.データ科学を利用して新規材料を効率的に発見しようとする試みは「材料情報学(マテリアルインフォマティクス)」と呼ばれています.わたしたちの研究室では,機械学習による様々な材料分析について材料科学者との連携のもと取り組んでいます.
- 生物情報学に関する研究
生物学ではデータ科学による解析が様々なかたちで行われています.例えば近年では大量のゲノム情報を取得できることも珍しくなくなり,生命現象をゲノムデータの統計解析により理解しようとする試みは一般的になりました.わたしたちの研究室では,生物学研究者との連携により,タンパク質のデータ分析などを通して機械学習によって生物学的発見を促進するための枠組みの研究を行っています.