予測手法
概要
JpTxGNN は知識グラフベースの機械学習手法を用いて、日本の承認医薬品に対する新規適応症を予測します。
TxGNN 知識グラフ
データ構造
TxGNN (Therapeutic Knowledge Graph Neural Network) は、薬物と疾病の関係を予測するための知識グラフです。
| 項目 | 数量 |
|---|---|
| ノード数 | 約 129,000 |
| エッジ数 | 約 8,000,000 |
| 薬物ノード | 約 7,958 |
| 疾病ノード | 約 17,081 |
関係タイプ
- indication: 承認適応症
- contraindication: 禁忌
- off-label use: 適応外使用
- drug-drug interaction: 薬物相互作用
- protein-drug interaction: タンパク質-薬物相互作用
予測パイプライン
┌─────────────────────────────────────────────────────────┐
│ 予測パイプライン │
├─────────────────────────────────────────────────────────┤
│ ステップ 1: 日本医薬品データ読み込み │
│ ┌──────────────────────────────────────────┐ │
│ │ SSK 薬価基準マスター (19,317 薬品) │ │
│ │ + KEGG DRUG データ (効能・効果) │ │
│ └──────────────────────────────────────────┘ │
│ ↓ │
│ ステップ 2: DrugBank マッピング │
│ ┌──────────────────────────────────────────┐ │
│ │ 日本語成分名 → 英語標準名 → DrugBank ID │ │
│ │ マッピング率: 約 22.5% │ │
│ └──────────────────────────────────────────┘ │
│ ↓ │
│ ステップ 3: 疾病マッピング │
│ ┌──────────────────────────────────────────┐ │
│ │ 日本語適応症 → 英語疾病名 → TxGNN ID │ │
│ │ マッピング率: 約 66.6% │ │
│ └──────────────────────────────────────────┘ │
│ ↓ │
│ ステップ 4: KG 予測 │
│ ┌──────────────────────────────────────────┐ │
│ │ 既知の薬物-疾病関係から新規関係を推論 │ │
│ └──────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────┘
エビデンスレベル
| レベル | 説明 | 信頼度 |
|---|---|---|
| L1 | 承認済み適応症 | 最高 |
| L2 | 臨床試験で検証済み | 高 |
| L3 | 症例報告あり | 中 |
| L4 | In vitro/動物実験 | 低 |
| L5 | 計算予測のみ | 最低 |
注意: 本システムの予測はすべて L5(計算予測のみ) です。
限界と注意事項
予測の限界
- 計算予測: すべての予測は計算に基づいており、臨床検証されていません
- マッピング精度: 薬物・疾病マッピングの精度が予測品質に影響します
- データ鮮度: 知識グラフは定期的に更新されますが、最新の研究が反映されていない場合があります
使用上の注意
- 予測結果は研究参考のみを目的としています
- 医療判断には使用しないでください
- 臨床応用には必ず適切な検証が必要です
参考文献
- Huang, K., et al. "Therapeutics Data Commons: Machine Learning Datasets for Drug Discovery and Development." Nature Biotechnology, 2021.
- TxGNN: A Graph Neural Network for Therapeutic Prediction
- DrugBank 5.0: A major update to the DrugBank database for 2018