PALACE: 点群・グラフ分類のための閉形式・適応ランドマークカーネル

背景と課題

永続図（Persistence Diagram）は、点群やグラフの位相的特徴を多重スケールで捉える表現で、トポロジカルデータ解析（TDA）の中心的な出力である。これを分類器の入力にするには、図をベクトル化するか、カーネル化する必要があるが、既存手法は次の課題を抱える：

均一グリッド配置：ランドマーク（参照点）を等間隔に配置するため、データ分布に適応せず、ドメインが拡大すると性能が急落する。
学習型手法（Persformer等）：高精度だが勾配学習が必要で、解釈性と理論保証が乏しい。
校正分割の必要性：予測の信頼区間を出すために追加データを要する。

提案手法

本論文はPLACEの適応版であるPALACEを提案し、被覆論（ルベーグ数判定基準）に基づく4つの閉形式保証を与える。

核となるアイデア

最遠点サンプリング (FPS)：ランドマーク位置を訓練ラベルのみから決定。最適なk-center被覆半径の2近似を達成。
等重み：重みを K の平方根分の1（K の -1/2 乗）に設定すると歪み下界（ラムダ）を最大化することを示す。
少数ハイパラ：予算・半径・帯域幅の3つ（各5択以下）の交差検証のみ。勾配学習は一切不要。

4つの閉形式保証

交差図非干渉条件下での構造的歪み下界（ラムダ）。図が集中する場合、均一グリッド比で予算を (D/L) の二乗倍削減。
等重み・FPS位置の最適性。
カーネルRKHS分類レート（オーダー (k-1) ルートK / ガンマルート m_min）と、Le Cam下界による必要閾値（m はルートK/ガンマのオーダー）。フィルトレーション選択則も閉形式で導出。
校正分割不要の予測ごとの信頼証明書（非漸近Pinelis型と漸近Gauss型）。

また、カーネル-Mahalanobisマージン（Mahalanobis型距離尺度）が化学グラフプール全体で最強の閉形式ランカー（平均Spearman相関約+0.60）であることを実証する。

結果と意義

Orbit5k：91.3 ± 1.0%でPersformerに匹敵し、閉形式の永続図ベース手法では最強。
COX2・MUTAG：永続図ベースの全競合を上回る。
DHFR：ECPの1pp以内で競争力あり。
ドメイン8倍拡大時：適応配置は94%を維持、均一グリッドは偶然レベル（4クラスで25%）まで崩壊。

勾配学習なしで学習型手法に並ぶ性能を達成し、かつ理論保証と予測ごとの証明書を提供する点が意義深い。

実務での使いどころ

創薬での化合物活性予測（COX2やMUTAGのようなグラフ分類タスク）や、製造・ロボティクスでの点群形状分類に直接適用できる。特に、データドメインが訓練時と推論時で大きく変動する状況で、均一グリッド型手法より頑健に動く。予測ごとに信頼証明書が出るため、医療・金融・規制業界など、説明責任と不確実性定量化が必須の領域で有用である。

注意点・限界

永続図の計算がボトルネックになり得る点は変わらず、大規模データには前処理コストが残る。
構造的歪み下界は「交差図非干渉」という条件下での結果であり、現実データで条件がどこまで成り立つかは個別検証が必要。
DHFRなど一部データセットではECPに僅差で劣る場合がある。
カーネル-Mahalanobisマージンの優位性は化学グラフプールでの実証であり、他ドメインへの一般化は追加検証を要する。

実務での使いどころ（要約）

創薬や材料科学における化学グラフ分類で、解釈可能かつ理論的に保証された分類器が必要な場面で活用できる。点群形状分類（製造業の品質検査やロボティクス）にも応用可能で、特にデータドメインが大きく変動するシナリオで均一手法より頑健に機能する。予測ごとに信頼証明書が出るため、医療・規制業界など説明責任を要する用途に適している。