西班牙國家研究委員會(CSIC)綜合系統生物學研究所和瓦倫西亞大學的一項研究揭示了 GISAID 數據庫中的數據處理錯誤,該數據庫是 SARS-CoV-2 基因信息的廣泛使用資源。這項發表在《病毒進化》上的研究調查了病毒突變和感染人類的能力,重點關注病毒刺突蛋白中的缺失修復事件,病毒利用刺突蛋白進入細胞。 研究小組發現,最初表明頻繁發生缺失修復事件(即病毒似乎正在糾正其基因組)的發現,很大程度上是由於病毒序列的處理方式存在錯誤。這些錯誤造成了一種錯誤的印象,即病毒修復突變的頻率高於實際情況。通過將數據庫信息與原始基因組測序數據進行比較,研究人員對病毒的基因變化有了更準確的了解。 CSIC 研究員兼研究負責人 Mireia Coscollá Devís 指出,由於不同實驗室之間數據處理的不一致,這些缺失修復事件的頻率被大大高估了。該研究證實,雖然一些修復事件是真實的,但大多數是序列處理的人為產物。最初報告的缺失修復事件中,只有不到 60% 能夠得到驗證,修正後的頻率估計比最初顯示的低 5 到 51 倍。 儘管這些修復事件很少見,但它們可以微妙地影響病毒的行為,可能影響病毒進入細胞的方式或與疫苗產生的抗體相互作用的方式。這項研究強調了仔細審查基因數據以避免對病毒進化得出不準確結論的重要性。科學家們還強調,西班牙需要一個共享病原體基因組數據的集中系統,以改善對傳染病的監測和應對。
SARS-CoV-2 突變研究揭示基因數據庫中的數據處理錯誤
编辑者: Katia Remezova Cath
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?
我们会尽快处理您的评论。