瑞士蘇黎世聯邦理工學院科學家在最新一期《自然》雜志上發表論文稱,他們開發出一款名為MetaGraph的DNA搜索引擎,能快速、高效地檢索公共生物學數據庫中的海量信息,為研究生命科學提供了強大的專業工具。
MetaGraph索引及大量DNA、RNA和蛋白質序列檔案。圖片來源:《自然》網站
MetaGraph的研發,源于科學界對日益龐大的基因測序數據“用不好、找不著”的現實困境。過去幾十年來,各類生物學數據庫規模呈爆炸式增長,然而原始測序數據往往碎片化、噪聲多、體量龐大,科學家難以直接從中高效提取有用信息。
MetaGraph的核心突破在于采用數學中的“圖結構”,將相互重疊的DNA片段智能聯結。其原理類似于圖書索引中將含有相同關鍵詞的句子關聯起來,形成知識網絡。研究團隊整合了7個公共資助數據庫,構建出一個跨越病毒、細菌、真菌、植物、動物乃至人類的生命全譜系索引。該索引共涵蓋1880萬個獨特的DNA與RNA序列集,以及2100億個氨基酸序列集。
基于這一龐大索引,團隊開發出了可直接通過文本提示檢索原始數據檔案的搜索引擎。團隊表示,這是一種與生物學數據交互的全新方式——數據被高度壓縮,卻可隨時調取。MetaGraph使研究人員能直接對“序列讀取檔案”(SRA)等存儲庫提出生物學問題,該數據庫本身包含超過1億個DNA字母。
為驗證其實用性,團隊利用MetaGraph掃描了24萬多個人類腸道微生物組樣本,搜尋抗生素耐藥性的遺傳標記。僅用一臺高性能計算機,約一小時便得出結果,展現出強大的分析效率。
法國巴斯德研究所生物計算專家拉揚·希基評價稱,這是一項“重大突破”,為分析DNA、RNA及蛋白質序列等原始生物學數據設立了新標準。這些數據庫規模驚人,可達“拍字節”(PB)級別,其條目數量甚至超過谷歌索引中的所有網頁。
瑞士蘇黎世聯邦理工學院科學家在最新一期《自然》雜志上發表論文稱,他們開發出一款名為MetaGraph的DNA搜索引擎,能快速、高效地檢索公共生物學數據庫中的海量信息,為研究生命科學提供了強大的專業工具......
瑞士蘇黎世聯邦理工學院科學家在最新一期《自然》雜志上發表論文稱,他們開發出一款名為MetaGraph的DNA搜索引擎,能快速、高效地檢索公共生物學數據庫中的海量信息,為研究生命科學提供了強大的專業工具......
瑞士蘇黎世聯邦理工學院科學家在最新一期《自然》雜志上發表論文稱,他們開發出一款名為MetaGraph的DNA搜索引擎,能快速、高效地檢索公共生物學數據庫中的海量信息,為研究生命科學提供了強大的專業工具......
究竟是什么讓人腦與眾不同?美國加州大學圣迭戈分校研究團隊發現了一個名為HAR123的小型DNA片段,這將是解開人類大腦獨特性之謎的關鍵。相關研究成果發表于新一期《科學進展》雜志。最新研究表明,HAR1......
究竟是什么讓人腦與眾不同?美國加州大學圣迭戈分校研究團隊發現了一個名為HAR123的小型DNA片段,這將是解開人類大腦獨特性之謎的關鍵。相關研究成果發表于新一期《科學進展》雜志。最新研究表明,HAR1......
基因組編輯技術作為生命科學領域的一項重要突破,為基礎研究和應用開發提供了技術支撐。以CRISPR及其衍生技術為代表的編輯系統通過可編程的向導RNA引導Cas9等核酸酶靶向基因組特定位點,被廣泛應用于特......
神經元中基因編輯的插圖。圖片來源:杰克遜實驗室哪怕在五年前,人們也會認為在活體大腦中進行DNA修復是科幻小說中才有的情節。但現在,科學家已能進入大腦、修復突變,并讓細胞在整個生命周期中維持住這種修復效......
國際知名學術期刊《自然》北京時間7月2日夜間在線發表一篇基因組學論文稱,研究人員從上埃及Nuwayrat地區一個古王國墓葬中提取到一名古埃及個體的全基因組測序數據,這些數據分析可追溯至古埃及第三至第四......
在一項研究中,科學家對埃及一座墓葬中的一名古埃及人進行了全基因組測序。這些數據可追溯至古埃及第三至第四王朝,揭示了其與北非及中東地區,包括美索不達米亞古人群的親緣關系,為早期埃及人的遺傳多樣性研究提供......
近年來,環狀單鏈DNA(CssDNA)因其穩定性高、免疫原性弱、可編程性強,成為基因調控、細胞治療等醫學合成生物學領域很有潛力的分子工具之一。近期,中國科學院杭州醫學研究所研究員宋杰團隊針對此前開發的......