近日,河北農業大學馬峙英教授團隊在《Nature Genetics》發表研究成果,構建了首個棉花端粒到端粒(T2T)泛參考基因組,揭示了百年陸地棉育種進化中結構變異及基因效應。河北農業大學張艷教授、孫正文副教授、吳立強研究員、谷淇深博士、柯會鋒高級實驗師、張桂寅研究員,北京諾禾致源科技股份有限公司田仕林研究員為同等貢獻第一作者。河北農業大學王省芬教授、馬峙英教授為通訊作者。
![]()
該研究首先組裝了棉花優質品種“農大棉13號”(NDM13)T2T基因組,以及一個世紀以來的其他27個代表品種的近T2T基因組;發現了所有基因組中均存在的51551個一對一保守的直系同源基因,以及端粒、著絲粒、45S rDNA、片段重復(SD)和拷貝數變異(CNV)的染色體分布狀態;構建了28個品種15種不同植株組織的基因轉錄組圖譜,揭示了結構變異(SV)的熱點區以及SV、SD和CNV對基因表達或含量變化以及抗逆性的影響;發掘了數千個現代育種進化中的差異SV及其相關基因;基于NDM13的T2T為參考的泛基因組構建,以及在全球1600余份種質資源樣本中鑒定出的76萬余個SV和來自我國長江流域、黃河流域和西北內陸三大棉區22個環境(地點、年份)的產量、品質、抗病性表型鑒定數據,捕獲了大量影響關鍵育種性狀的SV。研究成果有望推動作物的遺傳研究和生物技術改良。
該研究破譯28個棉花T2T基因組及基因家族表達規律。根據地理來源、育種用途、表型變異和分子親緣關系等因素,從源自世界多個植棉國、涵蓋最近一個世紀(1910s–2020s)育種歷程的1671個重測序(11.87×)品種(系)中,選取28個具有代表性的棉花品種。首先,組裝了纖維品質最好的國標I型優質棉品種“農大棉13號”(NDM13)(抗病蟲、耐鹽堿、高產優質,纖維長度32.2–32.6mm,比強度32.9–33.4cN/tex,馬克隆值4.1–4.2,整齊度指數84.7-85.0%,紡紗均勻指數162–165,2019年獲得國家科學技術進步獎二等獎)的T2T基因組,基因組總長2294.02 Mb,并解鎖了所有著絲粒、端粒和45S rDNA等染色體復雜區域。隨后對其他27個代表性棉花品種進行了基因組從頭組裝,破譯了其全部染色體序列,基因組總長度平均為2294.90(2291.33–2298.52)Mb,染色體序列連續性、完整性和準確性與NDM13相當(近T2T)。28個基因組平均注釋了79878(79373–80450)個蛋白質編碼基因,總共85211個基因家族,并在所有基因組中鑒定出51551個保守的一對一同源基因。對每個品種在開花結鈴期的15個營養、生殖組織的RNA測序數據分析發現,核心基因在生殖過程和物質吸收方面更為活躍,有24972個核心基因在纖維組織中的表達量顯著高于其他14種組織中的任何一種,這些基因主要集中在與纖維發育相關的生物過程。
該研究解碼棉花泛基因組結構變異和染色體熱點區域。在28個基因組平均鑒定出7746(3282–10088)個結構變異(SV≥30bp),總計33715個非冗余SV。發現3387個INS和3541個DEL位于5989個基因(INS/DEL-gene)或其1kb側翼區域,可能通過影響編碼和調控位點而改變基因功能。研究發現INS-gene和DEL-gene的表達水平顯著高于非INS-gene和非DEL-gene,在15種組織中均是如此,表明這些INS和DEL與基因表達水平提高有關。發現202個變異熱點區域,同時在不同品種之間也觀察到了差異,揭示了育種進化過程中產生的SV多樣性。At01一個SV熱點包含653個獨立SV,由6個dirigent家族成員組成基因簇,在非生物和生物脅迫中調節細胞壁代謝。在Dt01另一個熱點區聚集著20個抗病相關基因,在抗逆育種進化中具有重要作用。87.65%的倒位與串聯重復序列重疊或相鄰,暗示倒位形成最有可能的機制是非等位同源重組。發現35.39%的易位事件導致了基因的新生或丟失,其中分別有64.81%和84.92%屬于染色體間TRANS,表明染色體間易位更有可能導致基因組成的變化,易位事件所涉及的所有基因主要富集于植物生長發育以及生物和非生物脅迫響應路徑。
該研究揭示我國現代棉花育種基因組改良新貢獻。現代育種塑造的棉花基因組變異狀況尚不明確。將2000年以來我國培育的10個現代品種與基礎種質Deltapine15(1950年引入的美國品種)和徐州209(1958年從美國Stoneville2B中選育)的比較發現現代品種在纖維產量和品質方面有了顯著改良。在所有現代品種中分別鑒定出與Deltapine15和徐州209相同的SV涉及許多基礎代謝相關基因。重要的是在現代品種中分別鑒定出7211個和7930個與Deltapine15和徐州209不同的SV,分別有393個和47個與纖維品質和產量性狀相關,反映了我國品種改良過程中變異譜系和對現代育種的遺傳貢獻。在現代棉花品種與Deltapine15和徐州209進行比較時分別鑒定出6677個和7473個一對一的同源SV-gene,81.13%(5417個)和 81.16%(6065個)在15種棉株組織的至少1種中表達,這些變異在育種進化過程中對生物/非生物脅迫響應和纖維發育產生了重要影響。
該研究解碼棉花圖形基因組和群體變異育種效應。利用NDM13基因組作為線性基準參考,并基于27種棉花中的32970個非冗余的插入/缺失序列(≥30bp)構建了圖形基因組。對1671個深度測序品種(系)進行基因分型,總共鑒定出30840個INS/DEL-SV,分型SV比例高達93.54%,表明該圖形基因組中SV的代表性廣泛。進一步確定了2382個差異顯著的SV在至少1種纖維品質和產量性狀(22個環境的表型)中存在差異,包括纖維長度、強度、細度、棉鈴重、衣分和子指等。分析發現1027個SV與基因表達水平顯著相關,預示這些基因影響著纖維品質和產量性狀。發現Dt06上1個纖維長度QTL包含MHCKBL基因,其啟動子存在196bp SV,導致纖維長度29.30mm與26.56mm的顯著差異。GWAS揭示了2768個SV與纖維產量、品質、開花期和黃萎病抗性顯著關聯。新發現一些與先前研究相比具有顯著關聯信號的染色體區域,包括針對纖維長度的At02和Dt03、針對纖維強度的Dt11和Dt13、針對纖維細度和成熟度的At05和Dt03、針對棉鈴重的At12、針對衣分的Dt03和Dt11,以及針對子指的Dt11等區域,并產生了新的關聯變異,有45個SV增加了對棉花黃萎病的抗性。發現Dt11存在1個2845bp缺失片段,覆蓋了編碼冷響應蛋白激酶1基因(CRPK1),CRPK1 在高強力品種中特異性表達,進而影響了纖維強度。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.