一、核心概念
高同源區段指的是在不同DNA序列之間,存在異常高程度的序列一致性的基因組區域。
“同源”:這意味著這些序列共享一個共同的祖先序列。高相似性通常是由于在進化過程中,這些區域受到強烈的功能約束或受限于復制時間而未分化。
二、高同源區段的類別
1.亞基因組
在異源多倍體生物中(如小麥、棉花、油菜),它們由兩個或多個不同的祖先物種雜交形成。形成的新基因組中,來自不同祖先的幾套染色體組就被稱為亞基因組。
與高同源區段的關系:
這些不同的亞基因組擁有共同的遠古祖先,因此它們之間在整體上就是同源的。在異源多倍體物種中,不同亞基因組之間的同源染色體上存在大量高同源區段。例如,小麥A基因組上的某個基因區段,在B和D基因組的對應位置上,幾乎一定能找到序列高度相似的區段。這些高同源區段的存在是多倍體物種進行基因表達調控(例如部分同源基因的選擇性沉默或表達)和減數分裂時染色體正確配對的分子基礎,同時也為育種提供了豐富的遺傳變異。
2.假基因
假基因是基因組中由于突變(如移碼突變、無義突變、啟動子缺失等)而喪失原有蛋白質編碼功能的基因拷貝。
與高同源區段的關系:
假基因來源于功能性基因的復制(通過逆轉錄或基因組DNA復制),因此在誕生之初,它與它的親本功能基因的序列是高度同源的。隨著時間推移,由于不再受到自然選擇的壓力,假基因會積累更多突變,其序列同源性會逐漸降低。但一個“年輕”的假基因與其功能基因之間,依然會是一個典型的高同源區段。識別假基因的主要方法之一,就是在基因組中發現與功能基因序列高度相似但含有致命突變(如提前出現終止密碼子)的區段。
3.重復序列
指在基因組中重復出現多次的DNA序列。可分為兩大類:串聯重復序列:如衛星DNA(著絲粒、端粒區)、微衛星DNA。散在重復序列:如轉座子,包括DNA轉座子和逆轉錄轉座子。
與高同源區段的關系:
重復序列的本質就是自我復制和增殖。同一個家族的重復序列(尤其是轉座子)在基因組中有成千上萬個拷貝。這些拷貝之間序列高度相似,構成了基因組中常見的高同源區段。這些高同源區段是基因組組裝的主要挑戰,因為短的測序讀數無法準確區分這些幾乎一模一樣的區域,容易導致錯誤。同時,它們也是染色體在減數分裂時發生非等位同源重組的主要根源,從而導致基因缺失、重復等結構變異。
4.同源基因
指來源于一個共同祖先基因的那些基因。根據來源方式可分為:
直系同源基因:源于物種形成事件(如人類和老鼠的胰島素基因),通常保留相同功能。
旁系同源基因:源于基因復制事件(如人類體內的多個珠蛋白基因),功能可能分化。
與高同源區段的關系:
同源基因之間必然存在同源區段,但其相似性“高”與否取決于進化時間和功能約束。近期產生的旁系同源基因(如人類HBA1和HBA2珠蛋白基因):序列一致性高,是典型的高同源區段。它們可能形成基因簇。古老的同源基因:雖然同源,但經過億萬年的變異積累,序列相似性可能已經不高,主要在關鍵功能域上保留較高相似性。
測序過程中,高相似性的序列容易引發測序錯誤和數據分析的困難。那如何解決這問題呢?
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
手機版
化工儀器網手機版
化工儀器網小程序
官方微信
公眾號:chem17
掃碼關注視頻號

















采購中心