20多年前,曾參與人類基因組計劃的MIT生物學(xué)教授Jonathan Weissman是這項新研究的負責(zé)人。他說:“這是一個極為豐富的資源,就像人類基因組那樣,所有科學(xué)家都可以使用。你可以利用它進行基于發(fā)現(xiàn)的研究。有了這個基因型-表型關(guān)系圖譜,你不需要預(yù)先定義你要研究的生物學(xué)問題,就可以直接進入并篩選數(shù)據(jù)庫,而且,你也不需要做任何實驗。”
該研究共同通訊作者、Weissman實驗室的前博士后研究員Tom Norman說:“我認為這個數(shù)據(jù)集將使來自生物學(xué)其他領(lǐng)域的學(xué)者進行我們從未想到過的分析?!?/span>
這項研究使用了Perturb-seq方法能夠以前所未有的深度跟蹤基因開啟或關(guān)閉的影響。該方法于2016年由Weissman等人提出,但當時只能用于小規(guī)模的基因,且成本高昂。
Perturb-seq方法使用CRISPR-Cas9基因組編輯技術(shù)將遺傳變化引入細胞,然后使用單細胞RNA測序來捕獲有關(guān)因特定遺傳變化而表達的RNA信息。由于RNA控制著細胞行為的方方面面,因此,這種方法有助于解碼遺傳變化對細胞的諸多影響。
自從發(fā)表了概念驗證研究以來,Weissman等人已經(jīng)在較小規(guī)模研究中使用了這種篩選方法。例如,他們在2021年使用Perfert-seq探索了人類和病毒基因在感染常見皰疹病毒HCMV的過程中是如何相互作用的。
在這項新研究中,Weissman團隊將該方法擴展到了整個基因組。他們利用人類血癌細胞系和來自視網(wǎng)膜的非癌細胞,對超過250萬個細胞進行了Perturb-seq測序,并利用這些數(shù)據(jù)構(gòu)建了一個將基因型與表型聯(lián)系起來的全面圖譜。
在完成篩選后,研究人員使用新數(shù)據(jù)集研究一些生物學(xué)問題。
Norman說:“Perfert-seq的優(yōu)點是,它可以讓你以一種無偏差的方式獲得一個大數(shù)據(jù)集。沒有人會知道你在使用這種數(shù)據(jù)集時會遇到什么限制。現(xiàn)在你更應(yīng)該關(guān)注的是,到底用它來做什么?”
第一個明顯的應(yīng)用是研究具有未知功能的基因。由于新篩選讀出了許多已知基因的表型,研究人員可以使用這些數(shù)據(jù)將未知基因與已知基因進行比較,并尋找相似的轉(zhuǎn)錄結(jié)果,這可能表明基因產(chǎn)物會作為更大復(fù)合物的一部分協(xié)同工作。
其中一種名為C7orf26的基因突變尤為突出。研究人員注意到,將其刪除后導(dǎo)致相似表型的基因是稱為整合子的蛋白質(zhì)復(fù)合物的一部分,該復(fù)合物在產(chǎn)生核RNA中發(fā)揮作用。整合子復(fù)合物由許多較小的亞基組成,之前的研究表明其包含14種單獨的蛋白質(zhì)。現(xiàn)在,研究人員證實,C7orf26是構(gòu)成這種復(fù)合體的第15個組成部分。
他們還發(fā)現(xiàn),15個亞基在較小的模塊中協(xié)同工作,執(zhí)行整合子復(fù)合物中的特定功能。研究人員表示,如果沒有這些重要的見解,就無法弄清楚不同的模塊在功能上是否存在差異。
Perfert-seq的另一個優(yōu)點是,由于分析側(cè)重于單個細胞,研究人員可以使用這些數(shù)據(jù)來觀察更復(fù)雜的表型。通常,這些表型與來自其他細胞的數(shù)據(jù)一起研究時會變得混亂。
Weissman說:“我們經(jīng)常把‘基因X’被敲除的所有細胞當作整體來觀察它們是如何變化的。但有時,當你敲除一個基因時,缺少同一個基因的不同細胞會表現(xiàn)出不同的行為,而這種行為可能會被忽略?!?/span>
研究人員發(fā)現(xiàn),刪除一個基因子集會導(dǎo)致不同細胞產(chǎn)生不同的結(jié)果,這與染色體分離有關(guān)。它們的移除會導(dǎo)致細胞失去一條染色體或增加一條額外的染色體,這種情況被稱為非整倍體。
Weissman說:“你無法預(yù)測丟失這個基因的轉(zhuǎn)錄反應(yīng)是什么,因為它取決于你獲得或丟失的染色體的次級效應(yīng)。我們意識到,這個局面其實是可以扭轉(zhuǎn)的,創(chuàng)建這種復(fù)合表型,尋找獲得和丟失染色體的特征。通過這種方式,我們在全基因組范圍內(nèi)篩選出正確分離DNA所需的因子。”
Norman說:“我認為非整倍體研究是迄今為止這一數(shù)據(jù)有趣的應(yīng)用。它捕獲到到一種只能通過單細胞讀數(shù)獲得的表型。你無法以任何其他方式去追蹤它?!?/span>
研究人員還利用他們的數(shù)據(jù)集研究了線粒體如何應(yīng)對壓力。線粒體是由自由生活的細菌進化而來,其基因組攜帶13個基因。在核DNA中,大約1000個基因與線粒體功能有關(guān)。
長期以來,人們一直對核DNA和線粒體DNA在不同細胞條件下如何協(xié)調(diào)感興趣,尤其是當細胞受到壓力時。
研究人員發(fā)現(xiàn),當他們擾亂不同的線粒體相關(guān)基因時,核基因組對許多不同基因變化的反應(yīng)是相似的。然而,線粒體基因組的反應(yīng)要多得多。
研究人員表示,為什么線粒體會有自己的DNA,這仍然是一個懸而未決的問題。從他們的研究中可以看出,擁有單獨線粒體基因組的一個好處可能是對不同的應(yīng)激源進行局部或特異性的基因調(diào)節(jié)。
Weissman說:“如果一個線粒體損壞,而另一個線粒體是以不同的方式損壞,那么它們可能會做出不同的反應(yīng)。”。
在未來,該團隊還將繼續(xù)探索基因功能圖譜,并希望在癌細胞系之外的不同類型細胞上使用Perturb-seq。
Norman說:“這真的是大家多年共同合作的成果,我很高興看到它再次成功并得到擴展?!?/span>