LMSSitesePortfolioRegisterLogin
閒話基因體科學_5.X檔案:人類X染色體之謎
by 陳怡蓁, 2012-08-21 13:26, Views(1062)

X檔案:人類X染色體之謎

 

臺大醫學院  謝豐舟教授

     

2005317日之自然學刊發表人類X染色體之基因序列。(圖一)X染色體是女性“feminism”以及母性“motherhood”之根源,此外,我們知道X染色體與人類的認知能力頗有關連:例如,男性智障的機率較女性為高。目前,已知會導致心智障礙的221種人類遺傳疾病,有10%其相關基因是位於X染色體上。事實上,X染色體的基因數目只佔人類基因總數的不到4%。因此,X染色體可能是人類有別於猩猩的關鍵。X染色體可能潛藏著人性(humanity)的秘密,也是人類會寫詩詞、設計原子彈的原因。

發表於自然期刊的人類X染色體基因序列,涵蓋了X染色體真染色質(euchromatin)的99.3%。目前有14個缺口(gap)仍未定序完成,每一缺口均小於1Mb。估計X染色體總長應為155Mb;其中有1098個基因(699 known genes, 132 novel coding sequence, 166 hovel transinpts, 101 putative transinpts),700個假基因(644 processed; 56 non-processed)。X染色體為low gene density,且為low gene lengthmean 49kb),不過人類已知最長的基因dystrophinDMD)卻是位在X染色體(Xp21.2)之上,總長2,220,223bpX染色體的CpG island預測為5.25Mb是為基因體整體之半,其中約49%的CpG island與已知基因相關。

與小鼠、大鼠、斑馬魚、河豚相比對,人類染色體可以辨認出4,493處演化保留區(evolutionary conserved regions, ECR)其中4,339ECR4,373處已知exon重疊,剩下的100ECR可能是未知之exon,也有可能是高度保留的結構或調控單位。據此,可以推斷目前我們已經辨認出97.8%的protein-coding exons

X染色體序列可以定出173ncRNAnon-coding RNA)基因、2trasfer RNA 基因、13microRNA 基因。X染色體上最稱的ncRNA基因就屬XISTX-inactive-specific transcript)基因,它位於Xq13,長30,103bpXIST基因之transcript會覆蓋一條X染色體並使之停止轉錄,因此它扮演著XCIC (X chromosome inactivation)的關鍵角色。XISTtranscript是一個19,275 bpRNA,其中有染色體上最長的exon。(exon 1 長達11,372 bp)。其他還有經由alternative splicing產生的較短transcript。小鼠有XISTantisense Tsix,人類可能也有XISTantisense trancript但尚未證實。人類基因體序列中還有二個ncRNA基因在XIST遠端400 kb處,它們是小鼠JpxFxthomologueX染色體約十分之一的基因,是屬於所謂的cancer-testis-antigen基因;它們只表現於某一些癌組織,正常組織則僅見於testis。這些cancer-testis-antigen基因的功能仍不清楚,不過他們在X染色體上的集中( enrichment) 顯示這些基因可能對男性有利。

X染色體真染色質的interspersed repeats56%,遠高於基因體平均值45%。其中Alu的數目低平均值,此與X染色體之低基因密度有關。long terrnal repeat (LTR)數目在平均值之上,而L1則高達29%,遠高於基因體平均值的17%,這與XC1X chromosome inactivation)有關。以5Kb 中有90% sequerice identity為標準,X染色體上的intrachromosomal segmental duplication2.59%inter chromosomal segmental duplication則只佔0.24%

X染色體上共有153,146 SNP,其中901會導致non-synonymous protein coding,此為研究protein variant的標的。由SNP之分析來看X染色體的heterozygosity level僅為體染色體(autosome)的57%。

 

人類X染色體的演化

哺乳動物包括Eutheria, Metatheria以及Prototheria的雄性具有XY性染色體。依Ohno 1967年的理論,哺乳類性染色體源自一對體染色體。由於這對原始性染色體(proto-sex chronosome)的recombination受阻,導致突變的累積而使染色體退化,其極致就是Y染色體,但X染色體的基因也難逃影響。

哺乳動物性染色體源自體染色體,此一現象藉由比對雞與人類的基因序列可以就可知曉。人類X染色體Xp 11.3pter包括PARI受雞的1q的一整區相符合。Xq與雞4pdistal 20Mb則有30個區段相符合,但是Xp11.3cen之間則在雞的12, 1, 4號染色體有零星的符合小段。此區也富含雞所沒有的Cancer-testis antigen 基因。因此人類的X染色體可以分為(圖二)

1. XCR: X-conserved region此區包含Xq,來自proto-x-chromosome

2. XAR: X-added region,來自另一體染色體之轉位。發生的時間為eutherian分歧之前(~105 Myr)。

根據本研究,Xp 11.3~Xcen應不屬XCRXAR可能來自X染色體與1個環狀染色體的recombination。與鼠類基因體相較,大鼠與人類之X染色體有11個相符區段而小鼠與人類則有9個相符區域,這些相符區段幾乎佔滿整個X染色體,這表示eutherian mammalsX染色體。確實具有高度保留的synteny。以狗之基因體為outgroup,人類與狗之X染色體基本上是colinear。這表示人類的X染色體與原始的eutherian mammalian X染色體是相同的。人類與鼠類X染色體相較最大的差別在人類在短臂之遠端多出9Mb的一段(含PARI)。此區段的34個基因,在小鼠僅可以找到5個大鼠則可以找到13個(大部份在12號染色體)。但是在雞的1號染色體則可以找到24個。因此我們可以說這個9Mb的區域本來是存在於XAR,但在鼠類祖先則被移去。

與鼠類(rodent)相較,人類與鼠類之X染色體,基本上完全符合,但這些序列在小鼠分成9個區段,在大鼠則分成11個區段。不過在Xpter,人類多出了9Mb的一段(PAR1)。此段的34個基因中,小鼠只有5個,大鼠只有13個,散見於體染色體,但雞卻有24個,集中在1號染色體。我們可以推論:此一9Mb的區段本存於XAR,後來在鼠類的祖先才失去。X染色體之演化可以分為五層(stratum)—S1S2S3S4S5。過去認為只有S1~S4,但分析目前所完成的X染色體基因序列,在短臂之遠端可以再分出一段S5S1S5是從XqXp順序排列。S1+S2佔有XqXp近端。這些基因源自proto-sex-chromosomeS3+S4則佔據Xp上之XAR區,S5則在p terminal  S1S2gene pair比較divergentS3S4gene pair則較similar,而S5gene pair相似度最高。此一分佈傾向,似與XCI的程度有關。基因的XCI程度從S1S5遞減,15%不受XCI的基因都在XAR的遠端( PAR1S5S4)S3較少,XCR則只有幾個。有趣的是,L1的分佈也是此一傾向,越向Xpter越少,此一現象支持XCIL1way station的說法。

雖然X染色體只佔基因體的4%,但幾乎已知Mendelian disease中,10%的基因是位在X染色體上(307/3199)。對隱性基因而言,當Y染色體上沒有同源基因時,X染色體上的基因若生突變,在男性身上就會發病,因此極易被發現。學者積極對這些X-linked phenotypes進行positional cloning。迄今168X-linked phenotype的基因已被確定,其中的43種得力於X染色體的定序,因為由X染色體的序列,可以找出相關染色體位置上的candidate gene,以供臨床比對。

從找尋稀有疾病的基因,可以獲得極重要的生物學內涵。例如SH2DIA突變基因的發現,導致新的免疫基因被確認。在心智障礙方面,男性比女性常見。迄今X染色體上有16個基因與NS-XLMR(non-syndromic X-linked mental retardation)有關。NS-XLMR除了心智障礙沒有其他症狀。這些基因所產生的蛋白質範圍甚大,有些基因也與syndromic mental retardation有關,例如ARX基因與NS-XLMR有關,更與infantile spasm syndrome ISSXOMIM 308350dystoric hand movementPartington syndromePRTSOMIM 308510)有關。MECP2基因,除NS-XLMR之外,還與Rett syndrome in girlsRTTOMIM 312750)有關。由於絕大部分的NS-XLMR的基因仍屬未知,因此學者推斷X染色體上有多達100個基因與NS-XKMR相關。因此X染色體的序列必定有助於我們對人類心智相關基因的瞭解,這也是神經科學重要的一環。

人類登陸了月球,往後更可以登上火星,甚至土星、木星….,但人類X 染色體定序完成可就這麼一次。

 

 

參考文獻

1.      Check E:Genetics: The X factor, Nature 434,266-267,17 March, 2005.

2.      Gunter G:Genome biology: She moves in mysterious ways, Nature 434:279-280, 2005.

3.      Ross NT et al:The DNA sequence of the himan X chromosome, Nature 434,325-337, 2005.

4.      http://www.nature.com/nature/focus/humangenome/1