近日,電子信息與電氣工程學院自動化系沈紅斌教授、袁野副教授的課題組(模式識別與生物信息學課題組)在《自然-計算科學》(Nature Computational Science)上發表題為《利用圖神經網絡對空間轉錄組數據進行細胞聚類》(Cell clustering for spatial transcriptomics data with graph neural networks)的研究論文。
論文提出了一種基于圖卷積神經網絡的空間轉錄組細胞聚類方法(Cell Clustering for Spatial Transcriptomics,CCST)。此前針對該類數據的處理模型大都基于“同種細胞在空間上相互臨近”的這一假設。相比之下,CCST并不依賴于局部特征,而是可以從細胞的全局空間分布中學習節點嵌入。具體方案為:首先將空間轉錄組建模為圖結構的數據。圖中每一個節點代表一個細胞,其原始表征為高維的基因表達信息。圖的鄰接矩陣則依據細胞之間的空間距離建立。隨后分別提取圖上的局部特征和全局特征,以最大化局部和全局特征間的互信息為目標,訓練圖神經網絡模型,從而得到帶有全局結構信息的節點嵌入,再對各細胞所對應的表示向量進行聚類來識別細胞類型,最后從生物功能角度對聚類結果進行了深入分析。