該研究以「DeepAIR: A deep learning framework for effective integration of sequence and 3D structure to enable adaptive immune receptor analysis」為題,于 2023 年 8 月 9 日發布在《Science Advances》。
適應性免疫受體(AIR)識別抗原以激活隨后的免疫反應,從而清除腫瘤細胞和入侵的病原體。T 細胞受體 (TCR) 和 B 細胞受體 (BCR) 是 AIR 的兩種主要類型。TCR 與細胞表面主要組織相容性復合物(即肽-MHC、pMHC)呈遞的肽(抗原)結合,而 BCR 直接識別天然抗原和同源抗原。準確識別 AIR 抗原識別對于了解適應性免疫系統以及設計免疫療法和疫苗至關重要。
高通量批量測序技術已廣泛應用于分析 V(D)J 基因和 AIR 的克隆多樣性。V(D)J 基因的此類序列數據的可用性允許根據序列衍生特征對識別相同抗原的 AIR 進行聚類。
然而,高通量批量測序技術通常僅捕獲 AIR 的一條鏈,這不足以描繪受體的完整序列特征,從而阻礙了基于序列特征的 AIR 抗原識別的可靠預測模型的開發。單細胞免疫組庫測序技術的最新進展已經能夠捕獲受體的兩條鏈,為構建 AIR 抗原結合預測模型提供完整的 V(D)J 基因測序數據。大多數 AIR-抗原結合預測模型側重于結合反應性(或稱為結合特異性)的預測,即 AIR 是否與特定抗原結合。
建立可靠的 AIR-抗原結合預測模型可以幫助適應性免疫系統的實驗研究。目前的模型,如 DeepTCR、TCRAI 和 soNNia,都是基于 AIR 的序列信息。然而,AIR 的結構在識別抗原并與抗原相互作用方面發揮著重要作用。
雖然實驗成本高昂而導致缺乏 AIRs 的結構數據,但由于最近蛋白質結構預測器 AlphaFold2 的突破,已經提供了大量準確預測的AIRs結構數據。現在可以研究如何使用預測的 AIR 結構來增強 AIR 分析的計算模型,包括 AIR 抗原結合預測和免疫庫分類。
深度學習用于結構增強的 AIR 分析
騰訊 AI Lab 的研究人員提出了一個名為 DeepAIR 的深度學習框架,用于結構增強的 AIR 分析。DeepAIR 的功能包括 AIR 抗原結合預測和免疫庫分類。DeepAIR 使用專門設計的基于門控的注意力機制和張量融合機制,利用 AlphaFold2 預測的 AIR 結構信息來進行 AIR 抗原結合預測。
最后,對于包含大量不同 AIR 的免疫庫,使用 AlphaFold2 預測免疫庫中每個 AIR 的結構非常耗時。為了解決這個問題,專門針對 AIR 結構設計和優化的更輕、更快的預測模型將極大有利于未來 DeepAIR 和其他基于結構的策略。
結語
總之,DeepAIR 是一個全面且可解釋的深度學習框架,用于集成序列和結構信息的 AIR 抗原結合分析。DeepAIR 在 AIR 抗原結合反應性方面表現出出色的預測性能,并且優于 SOTA 預測器。研究人員預計 DeepAIR 可能成為分析與抗原高度相互作用的 AIR 的重要工具,從而更好地為個性化免疫療法的設計提供信息。