構建“整合AIR的序列和結構特征,預測免疫反應”學習框架

發布時間：2023-08-11 14:31 原文鏈接：構建“整合AIR的序列和結構特征,預測免疫反應”學習框架

適應性免疫受體（AIR，包括 T 細胞受體，TCR；B 細胞受體，BCR）與其同源抗原之間的結構對接是適應性免疫中最基本的過程之一。然而，目前預測 AIR-抗原結合的方法很大程度上依賴于 AIR 的序列衍生特征，忽略了結合親和力所必需的結構特征。

　　騰訊 AI Lab 的研究人員提出了一個名為 DeepAIR 的深度學習框架，通過整合 AIR 的序列和結構特征來準確預測 AIR 與抗原的結合。

　　DeepAIR 在預測 TCR 的結合親和力方面實現了 0.813 的 Pearson 相關性，在預測 TCR 和 BCR 的結合反應性方面的接受者操作特征曲線（AUC）下面積中值分別為 0.904 和 0.942。

　　同時，利用 TCR 和 BCR 庫，DeepAIR 在測試數據中正確識別出每一位患有鼻咽癌和炎癥性腸病的患者。因此，DeepAIR 改進了 AIR-抗原結合預測，促進了適應性免疫的研究。

　　該研究以「DeepAIR: A deep learning framework for effective integration of sequence and 3D structure to enable adaptive immune receptor analysis」為題，于 2023 年 8 月 9 日發布在《Science Advances》。

　　適應性免疫受體（AIR）識別抗原以激活隨后的免疫反應，從而清除腫瘤細胞和入侵的病原體。T 細胞受體 (TCR) 和 B 細胞受體 (BCR) 是 AIR 的兩種主要類型。TCR 與細胞表面主要組織相容性復合物（即肽-MHC、pMHC）呈遞的肽（抗原）結合，而 BCR 直接識別天然抗原和同源抗原。準確識別 AIR 抗原識別對于了解適應性免疫系統以及設計免疫療法和疫苗至關重要。

　　高通量批量測序技術已廣泛應用于分析 V(D)J 基因和 AIR 的克隆多樣性。V(D)J 基因的此類序列數據的可用性允許根據序列衍生特征對識別相同抗原的 AIR 進行聚類。

　　然而，高通量批量測序技術通常僅捕獲 AIR 的一條鏈，這不足以描繪受體的完整序列特征，從而阻礙了基于序列特征的 AIR 抗原識別的可靠預測模型的開發。單細胞免疫組庫測序技術的最新進展已經能夠捕獲受體的兩條鏈，為構建 AIR 抗原結合預測模型提供完整的 V(D)J 基因測序數據。大多數 AIR-抗原結合預測模型側重于結合反應性（或稱為結合特異性）的預測，即 AIR 是否與特定抗原結合。

　　建立可靠的 AIR-抗原結合預測模型可以幫助適應性免疫系統的實驗研究。目前的模型，如 DeepTCR、TCRAI 和 soNNia，都是基于 AIR 的序列信息。然而，AIR 的結構在識別抗原并與抗原相互作用方面發揮著重要作用。

　　雖然實驗成本高昂而導致缺乏 AIRs 的結構數據，但由于最近蛋白質結構預測器 AlphaFold2 的突破，已經提供了大量準確預測的AIRs結構數據。現在可以研究如何使用預測的 AIR 結構來增強 AIR 分析的計算模型，包括 AIR 抗原結合預測和免疫庫分類。

　　深度學習用于結構增強的 AIR 分析

　　騰訊 AI Lab 的研究人員提出了一個名為 DeepAIR 的深度學習框架，用于結構增強的 AIR 分析。DeepAIR 的功能包括 AIR 抗原結合預測和免疫庫分類。DeepAIR 使用專門設計的基于門控的注意力機制和張量融合機制，利用 AlphaFold2 預測的 AIR 結構信息來進行 AIR 抗原結合預測。

構建 DeepAIR 的計算框架

　　在預測 AIR 抗原結合反應性方面，DeepAIR 顯著優于基于序列的方法，包括 DeepTCR、TCRAI 和 soNNia。該團隊創建了兩個版本的 DeepAIR，包括基于結構的 DeepAIR-stru 和基于序列的 DeepAIR-seq，以研究結構信息對 DeepAIR 性能的貢獻。

　　實驗表明，DeepAIR-stru 顯著優于 DeepTCR、TCRAI 和 soNNia，而 DeepAIR-seq 并未達到最佳預測性能。性能比較表明，結構信息的集成促成了 DeepAIR 的優越性能。DeepAIR 成功捕獲了抗原結合 AIR 的結構模式，以將其與其他 AIR 區分開來。

　　DeepAIR 與 SOTA 方法在 AIR 抗原結合反應性預測方面的性能比較

　　DeepAIR 使用 AlphaFold2 預測的 AIR 結構。使用預測結構的主要優點是 DeepAIR 可以分析任何 AIR，只要其序列信息可用于結構預測。這對于 AIR 分析至關重要，因為實驗驗證的結構不適用于免疫庫中的大多數 AIR。

　　此外，根據第14屆蛋白質結構預測批判性評估（CASP14）的結果，AlphaFold2表現出與實驗結構相媲美的高精度。分析表明，使用全序列的 AIR CDR3 區域的中位預測精度與 CASP14 中實現的 AlphaFold2 的中位精度相當。

　　因此，研究人員認為在 DeepAIR 中使用 AlphaFold-2 預測的結構是可靠的。然而，預測結構的準確性仍然影響DeepAIR-stru的性能。為了減輕預測結構引入的這種偏差，DeepAIR 還使用多模態特征融合模塊集成序列和基因特征的信息，共同促進其預測。DeepAIR 的性能明顯優于 DeepAIR-stru 和 DeepAIR-seq。它揭示了融合模塊中基于門控的注意力和張量融合機制成功地從結構和序列中提取了可區分的特征，以實現卓越的性能。

　　DeepAIR 和 DeepTCR T 細胞受體結合親和力預測的性能比較

　　DeepAIR 是一個可解釋的模型，它顯示 α 鏈和 β 鏈中的重要殘基，這些殘基對于使用注意力權重的 AIR-抗原結合很重要。多項研究表明β鏈接觸殘基在AIR-抗原結合中的重要性，這也可以通過基于序列的深度學習模型來學習。

　　DeepAIR 可以突出顯示 β 鏈上的重要殘基，即 β 鏈和抗原之間的接觸殘基。DeepAIR 還可以識別 α 鏈上與 β 鏈接觸的關鍵殘基，從而穩定 AIR 結構，從而有助于 AIR 與抗原之間的結合親和力。大多數AIR-抗原研究集中在AIR的β鏈及其與抗原的接觸殘基上。DeepAIR 通過突出顯示 α 鏈和 β 鏈中結構和功能上重要的殘基，進一步能夠檢查 AIR-抗原復合物的穩定性。

　　新方法也存在局限性

　　目前的 DeepAIR 還存在一些局限性。

　　首先，該研究中使用的 TCR-pMHC 結合親和力值是通過 pMHC 捕獲的 TCR 的 UMI 計數來呈現的，而不是真實的結合親和力，因為測量 TCR 和 pMHC 之間的真實結合親和力具有挑戰性。盡管形狀互補統計和埋藏表面積經常被用來描述 TCR-pMHC 相互作用，但它們都不是 TCR-pMHC 結合親和力的可靠指標。

　　其次，由于 BCR 抗原結合親和力數據的可用性有限，該研究沒有評估 DeepAIR 在預測 BCR 抗原結合親和力方面的性能。由于來自同一 B 細胞的 BCR 和抗體具有幾乎相同的抗原結合親和力，因此 BCR-抗原結合親和力的預測可能與抗體-抗原結合親和力的預測基本相同。

　　隨著未來更多數據的出現，研究人員將結合這兩項任務，研究 DeepAIR 對抗體（BCR）-抗原結合親和力的預測能力。

　　當前 DeepAIR 框架的第三個限制是缺乏有關抗原的任何實際信息。這導致開發的模型的抗原覆蓋范圍僅限于訓練數據中包含的目標子集。未來該團隊將在建模中添加抗原序列和結構。

　　另一個限制是 AlphaFold2 預測的 AIR 結構是未配體的。然而，眾所周知，TCR 的 CDR3 環在 pMHC 結合后會發生構象變化。類似的情況也發生在抗原結合的 BCR 中。AIR結構的構象變化會影響AIR與抗原的結合；然而，AlphaFold2 無法預測這些變化。能夠準確預測抗原結合后 AIR 結構構象變化的先進方法無疑將有利于 AIR 抗原識別的研究。

　　并且，作為通用的蛋白質結構預測工具，AlphaFold2的預測模型對于預測AIR的結構并沒有進行優化。預測結構精度的提高可以極大地提高類似 DeepAIR 的基于結構的方法的性能。

　　最后，對于包含大量不同 AIR 的免疫庫，使用 AlphaFold2 預測免疫庫中每個 AIR 的結構非常耗時。為了解決這個問題，專門針對 AIR 結構設計和優化的更輕、更快的預測模型將極大有利于未來 DeepAIR 和其他基于結構的策略。

　　結語

　　總之，DeepAIR 是一個全面且可解釋的深度學習框架，用于集成序列和結構信息的 AIR 抗原結合分析。DeepAIR 在 AIR 抗原結合反應性方面表現出出色的預測性能，并且優于 SOTA 預測器。研究人員預計 DeepAIR 可能成為分析與抗原高度相互作用的 AIR 的重要工具，從而更好地為個性化免疫療法的設計提供信息。

更多與構建“整合AIR的序列和結構特征,預測免疫反應”學習框架相關的新聞

MAE-2000i 全自動化學發光免疫分析儀豬用系列ELISA診斷試劑盒蛋白從頭測序和突變分析（De Novo Sequencing）德國徠卡數字光片顯微鏡 STELLARIS DLS 全基因組甲基化測序 10x Genomics Chromium Controller 單細胞測序文庫構建解碼系統/GCG-SR-1

構建“整合AIR的序列和結構特征,預測免疫反應”學習框架

其他網友還關注過

Science子刊丨沒事曬曬太陽日光能增強免疫系統對抗感染的能力

研究人員發現衣康酸在不同細胞間的轉運機制

跨性別男性免疫反應差異需關注

跨性別男性免疫反應差異需關注

NatCommun：特殊抑制性通路的釋放或能促進機體抵御HIV感染的免疫反應

顛覆mRNA遞送技術：國內團隊開發非陽離子LNP系統，可靶向脾臟并誘發強大免疫反應

Nature：核糖體對合成mRNA的錯誤讀取竟可在體內引起意料之外的免疫反應

構建“整合AIR的序列和結構特征,預測免疫反應”學習框架

構建“整合AIR的序列和結構特征,預測免疫反應”學習框架

浙大揭示新冠病毒RNA非編碼區域與宿主蛋白質互作網絡