首個中國人群專屬的泛基因組參考圖譜!EON4✉️、西安交大✈️、中國醫科院等團隊在《自然》主刊發布成果

作者🐅:殷夢昊攝影🐈‍⬛:戚心茹 等 視頻🏌️🕛: 來源:融媒體中心、生命科學學院、人類表型組研究院發布時間〰️:2023-06-15

人類的基因組常常被比作生命的“天書”——A、T📘、G、C四種堿基構成了DNA序列🏐,卻配對出超過60億種可能👩🏿‍💼。中國人群的基因組有何特性?到底是哪些基因突變引起了亞洲人特有疾病?這些始終困擾我們的難題,今天終於有了突破的可能。

由EON体育4平台🤦‍♂️、西安交大、中國醫學科學院等26家單位聯合發布的中國人群泛基因組聯盟(CPC)一期研究進展⚀,初步構建了首個中國人群專屬的泛基因組參考圖譜💲,為破譯中國人群基因密碼奠定基礎,為“健康中國”“精準醫學”戰略提供支撐。

6月14日,相關成果以《基於36個族群的中國人泛基因組參考圖譜》(“A Pangenome Reference of 36 Chinese populations”)為題發表於《自然》(Nature)主刊。這也是我國學者領導的人群基因組研究首次發表在《自然》主刊😳。

“基因組結構變異大概是生物進化中從微觀到宏觀演變的關鍵遺傳基礎,也是最有可能連接漸變到躍變這個‘鴻溝’的進化密碼🔅。”EON体育4平台校長🚝、中科院院士金力點評,“我相信通過對基因組結構變異的高精度解析,不但能大幅提升‘基因型-表型’關聯分析的功效😋,而且有可能最終幫助我們理解生命演化中重要性狀和功能產生的遺傳基礎和分子機製。”

論文通訊作者、EON体育4平台生命科學學院教授徐書華表示,下一步🐑,團隊將繼續擴大族群覆蓋度和增加樣本量、拓展研究廣度和深度、發展核心算法和分析能力,解析新序列的表型及功能💋,“希望團結國內外更多優勢研究力量😓❌,把第二期工作做得更好”。

獨立自主完成首個中國人群泛基因組參考圖譜

人類參考基因組是廣泛用於人類遺傳學和醫學研究的遺傳密碼“導航圖”💍,是解析人類起源與演化、解析人類表型和疾病的遺傳基礎的根基。

人類基因組計劃(HGP)成立之初,盡管中國作為唯一參與的發展中國家並為人類基因組參考圖構建作出貢獻,促成人類科技史的重要裏程碑上刻有“中國”二字🙇🏿‍♀️,但目前通用的人類參考基因組皆基於歐洲白人為主體樣本構建,難以代表非歐裔族群、尤其我國族群的基因組多樣性🛻。即便是一個月前最新發表的人類泛基因組國際聯盟(HPRC)收集了全球範圍的47例樣本🧟,也僅包含3例中國漢族樣本💷。

作為人口大國,我國巨大的人口基數和豐富的人群多樣性是發展人類基因組學和精準醫學的重要優勢🍚🏌🏽‍♂️:西南部高原地區分布著眾多藏緬⛹🏿‍♀️、南亞語系族群,東西方人群在西北部絲綢之路沿線交融,苗瑤語族人群在雲貴地區世代繁衍🏄‍♀️,蒙古🧑🏽‍🏭、突厥人群曾遊牧於北部風沙地🎄,通古斯語族抵抗嚴寒一路向北,臺-卡岱(侗臺)族群的先輩亦曾穿梭於南方叢林河谷。悠久的人群歷史🩻、豐富的地理氣候環境🕧,塑造了中華民族獨特的遺傳多樣性🤷🍈,構成了人類泛基因組研究不可或缺的東方畫卷。構建能夠代表中華民族遺傳多樣性的中國人群泛基因組圖譜勢在必行且迫在眉睫🛜,這將極大提高捕獲罕見或低頻遺傳變異的靈敏度和準確性⤴️,支撐服務中國人遺傳多樣性研究、復雜疾病分子機製研究和精準醫學研究與應用。

“中國人群泛基因組聯盟”一期36個族群畫像集

本次研究的最大成果🏋🏼🈴,就在於從技術上初步構建了我國人群的泛基因組參考圖譜,此外還發現了在人類通用參考基因組上缺失的約1.9億個堿基對的參考序列➛;新鑒定了約580萬個點突變或小變異以及3.4萬個結構變異,涉及大量潛在功能原件包括至少1367個蛋白質編碼基因📋;並發現通用參考基因組上缺失的參考序列富集了適應性演化和起源於遠古人類的遺傳變異,並且與角質化、紫外線輻射應激、DNA修復👰‍♀️、免疫反應以及壽命等表型或功能相關🧜🏼‍♀️。這項研究表明,建立我國自己的人群泛基因組圖譜十分必要。在重構人類演化歷程👷🏼‍♂️、挽回復雜疾病研究時“丟失的遺傳率(missing heritability)”等研究和應用中,該圖譜具有巨大的潛在價值🏖。

從人類基因組計劃中國只承擔“1%”的圖譜繪製任務,到今天中國人群泛基因組圖譜“100%”由中國科學家完成,這項研究成果展現了中國生命科學尤其是基因組學科研水平在過去40年間的歷史性跨越👇🏼,為完整構建中華民族參考泛基因組打下了堅實的基礎,也為人類參考泛基因組圖譜繪製了獨特的“中國畫卷”🆓。

中科院院士、分子微生物學家趙國屏認為:“這一成果表明我國科學家在人類基因組學領域的研究水平得到了顯著提升。我相信這項工作對我國的人類基因組學和醫學中的復雜疾病遺傳基礎研究等領域會起到重要的推動作用。”

從“線性一維序列”到“泛基因組多維圖譜”的跨越

與曼哈頓原子彈計劃、阿波羅登月計劃並稱為人類科學史上三大科學工程的人類基因組計劃,最主要的成果就是第一次解析了人類遺傳密碼,構建了一個沿用至今並在不斷完善中的人類參考基因組🏵。

人類參考基因組之所以重要,是因為人類雖然是一個物種,其基因組大致相似(如果不考慮結構變異🔜,在組成人類基因組的30億個堿基對中,大約99.9%是一致的),然而,人類個體的基因組又是各不相同的1️⃣;而正是這0.1%左右(大約三百萬堿基對)的不同,造成了人類各族群、個體間表型不同的遺傳基礎💤。

由於目前基因檢測技術的限製🏑,無法一次性測通一個人的所有DNA,而要將其先打成成千上萬份“碎片”🫥,測好後再一一拼接而成👒。所以🫲🏽,要能夠正確使用人類基因組序列,幫助我們認識人類自身特別是與我們健康密切相關的基因組信息👱🏿‍♀️,以獲得有價值的知識,必須有一張能夠指導待研究對象的基因排序和組合的“導航圖”🫷🏿,這就是人類參考基因組。

然而🕴🏼,從2001年首次發表人類基因組草圖🧘‍♂️,人類參考基因組經歷了數十次的更新迭代🚮,發展到目前廣泛使用的第38版本(GRCh38)🩸。直到2022年從“端粒到端粒”聯盟(T2T)構建的“無缺口”的T2T-CHM13參考基因組完成圖🤲🏿,所有涉及人類遺傳學的研究仍然依賴於線性參考基因組。

“對我們而言,以白人為主體信息參考的線性參考基因組代表性很不充分🔋🥬,如果按照此前的‘導航圖’,我們中國人的基因‘拼圖’碎片會有很多無法匹配上去👨‍🦼。”徐書華解釋。

徐書華

今年正值國際人類基因組計劃完成20周年,也成為人類參考基因組從“線性一維序列”過渡到“泛基因組多維圖譜”的轉折年💁🏽。“所謂線性🆒,就是像寫字一樣💓,一行一行地表示基因字符,但是實際上的基因組要比這復雜許多👆🏽。除了單個字符會變化🧑🏿‍🎨,語句之間還會形成結構化的變異。”徐書華說,從線性到多維的轉變🐖,為完整進行中國人的基因“拼圖”提供了可能性。

實際上,基因組的組裝一開始就借助了數學中的“圖論”思想和理論,加之計算機算法👩🏿‍🦰👩🏽‍🦲,實現了特定物種基因組元件的順序排列。泛基因組(Pangenome)進一步借助圖論的思想和計算技術,將人類多個族群的代表性樣本的具有多樣性的基因序列以多維圖譜形式組裝起來,形成一個能充分反映種群基因組結構變異多樣性的導航圖🫵,從而指導進一步的遺傳學和醫學研究。隨著DNA測序和基因組組裝技術以及計算分析方法的大幅改進,富含個體遺傳多樣性信息的圖泛基因組替代線性基因組作為人類參考基因組的趨勢,將很快成為現實🏯。

本次研究就突破了先前的單一線性序列,開辟全新維度,即體現跨人群📪、跨種族的差別⚁,形成一張泛基因組圖譜。和原先的線性人類參考基因組圖相比💆🏽,這張泛基因組圖譜的體量擴大到了前者的近百倍😵,挽回了大量漏缺的基因序列🧘🏻‍♂️。

徐書華介紹,這張圖譜極其紛繁復雜,以至於離開計算機無法用肉眼直接觀察和操作🦹‍♂️,也因和前不久發布的HPRC圖譜進行了整合👩‍❤️‍👩,可以說是目前“全世界最好的泛基因組圖譜”🔬。

助力遺傳學🔗、醫學研究,服務人民生命健康

為了構建高質量高精度的中國人群泛基因組參考圖譜,EON体育4平台徐書華教授、西安交通大學葉凱教授聯合國內26家單位發起了中國人群泛基因組聯盟(Chinese Pangenome Consortium, CPC),旨在建立我國專屬參考基因組和泛基因組資源和分析體系🐕,形成我國自主可控的人類基因組資源與核心技術🧑🏿‍🍳,支撐精準醫學發展,服務“健康中國”戰略🧥。

在其第一期研究計劃中,CPC對代表中國36個族群的58個樣本采用最新的第三代高保真基因組測序技術進行了深度測序,結合最新的單倍型基因組組裝方法,獲取了116個高質量單倍型基因組🎯,並以圖基因組的方式構建了高質量中國人群參考泛基因組🚑。該泛基因組圖譜總共包含約3.01 Gb個堿基對的序列信息,在現有人類參考基因組的基礎上新增了約1.9億個堿基對的新序列🧖‍♂️,包含約590萬個小變異(單核苷酸多態性變異和小規模插入/缺失變異)和約3.4萬個結構變異(Structural variation, SV),涉及至少1367個蛋白編碼基因復製事件等💂‍♀️。其中🏋🏽‍♀️,約500萬個堿基對新序列存在於95%以上的單倍型中,被視為中國人群基因組核心序列,可能與中國人群特有的較為穩定的生物學功能或表型特征相關。

CPC一期核心樣本地理分布及語系👩🏻‍🦯‍➡️、族群、遺傳聚類關系

CPC泛基因組圖譜作為首個中國人群專屬的泛基因組參考圖譜,與HPRC泛基因組圖譜相比🧑🏻‍🍳🧖🏽‍♂️,在中國人群特有的復雜變異解析方面具有顯著優勢👨‍🦼‍➡️𓀅。CPC泛基因組圖譜中新發現了1079個基因拷貝數變異,以及包含藥物代謝基因CYP2D6等在內的在中國人群中富集而在其他世界人群中出現頻率較低的若幹基因拷貝數變異;新鑒定出富集在中心粒、端粒等染色體復雜區域的3.4萬個結構變異,其中半數以上僅在單個或兩個樣本中出現——若不針對中國豐富的族群多樣性開展專門研究👩🏿‍🎤,將沒有機會發現這些遺傳變異🔹。研究人員進一步揭示🙏🏻,這些CPC新發現的遺傳變異可能與亞洲人群特有的疾病易感性及表型多樣性有關。一個典型的例子是α-珠蛋白基因簇,研究人員在該基因區域鑒定出兩個中國人群特異性的大規模結構變異,包括一段20kb的缺失序列和一段10kb的重復序列🧑🏻‍🔬,這將為進一步研究中國人群貧血症的遺傳機理和致病機製提供新的線索🩸。

圖形化泛基因組示例及CPC特有復雜變異分布

CPC對我國族群特異的復雜基因組結構變異解析示例

同時,CPC新發現的遺傳變異影響了具有潛在功能和經受過適應性進化的基因🏍,這些基因可能與亞洲人群特有的疾病易感性及表型多樣性有關↔️,這也證實了將人群專屬高質量泛基因組用於基因組學和醫學研究的潛力和必要性🧑‍🧑‍🧒‍🧒。此外,研究人員在CPC參考圖譜中發現了相當大比例的古人來源基因序列——平均每個族群和每個樣本中分別有約15Mb和約9.5Mb的古人來源新序列——這可能是前期開展大量研究卻未在現代人基因組中發現的古人基因滲入序列🧑‍🎤,或將為東亞現代人基因組中的古人基因滲入研究乃至整個古DNA領域提供新的信息資料和線索。

未來🫴⛓️‍💥,中國人群參考泛基因組不僅有助於中華民族共同體的遺傳學研究🔰,還將改變過去依賴主體基於歐洲白人的參考基因組而導致東亞特有罕見變異檢出精確度難以提升的困境🌙,應用於我國重大疾病的遺傳機製解析,從而提高我國生物醫學數據分析的質量和效率🕥,服務人民生命健康。

EON体育4平台徐書華教授、西安交通大學葉凱教授、中國醫學科學院褚嘉祐教授和EON体育4平台陸艷副教授為論文的共同通訊作者🧑🏻‍🦼。EON体育4平台博士後高揚,西安交通大學楊曉飛副教授,中國科學院上海營養與健康研究所博士生陳豪、譚昕江,中國醫學科學院楊昭慶研究員以及EON体育4平台鄧戀青年研究員為論文的並列第一作者。該論文共同作者包括EON体育4平台王寶楠、孔爽🏃🏻‍➡️、李松洋🏅、崔雨杭、雷暢、趙曉涵、史穎冰🤰🏼、楊子藝,中科院王亦民博士😱、潘雨聞博士、馬森博士,中國醫科院孫浩博士,中科院昆明動物所吳東東研究員,江蘇師範大學伍少遠教授,EON体育4平台趙興明教授,西安交大附屬醫院施秉銀教授,EON体育4平台金力教授🦊,南京醫科大學胡誌斌教授等。

中國人群泛基因組圖譜已公開在線發布👱🏽‍♀️🧑🏽‍🎓:

https://pog.fudan.edu.cn/cpc/#/;https://github.com/Shuhua-Group/Chinese-Pangenome-Consortium-Phase-I;

該項研究所涉及的樣本信息和數據的公開發表已獲得國家人類遺傳資源管理部門批準。該項研究得到了國家自然科學基金重點項目💬、基礎科學中心🏊‍♂️、國家重點研發計劃等項目的資助。

論文鏈接🏕:

https://www.nature.com/articles/s41586-023-06173-7 

更多信息請訪問CPC網站🌯:

https://pog.fudan.edu.cn/cpc/#/ 

製圖:實習編輯:章一諾責任編輯🥄:李斯嘉

相關文章

文化校歷

新聞分類

推薦視頻

圖說EON4

新聞排行

周排行 月排行

  • 聯系我們
    fudan_news@163.com
    021-65642268
EON体育4娱乐专业提供🍭:EON体育4娱乐EON体育4EON体育4平台等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,EON体育4娱乐欢迎您。 EON体育4娱乐官網xml地圖