LMSSitesePortfolioRegisterLogin
閒話基因體科學_7.人類第六號染色體
by 陳怡蓁, 2012-08-21 13:28, Views(961)

人類第六號染色體

 

臺大醫學院 謝豐舟教授

 

    公元2003414日星期一,人類基因體計劃(Human Genome Project)提前畫下了一個完美的句點;2,825 megabase的人類基因序列定序完成。接下來,學者就針對個別的染色體作更進一步的分析並定義其中的基因(annotation)。幾年下來,7號、14號、20號、21號、22號及Y的完整序列陸續發表,而最近第六號染色體的完整序列也在十月二十三日的自然期刊出版。所以迄今人類2,825 megabase的基因序列中已有17%500 megabase)經過仔細分析及基因定義(annotation),剩下17個染色體還待努力。

第六號染色體是迄今完成分析的人類染色體中最大的一個,它共有166 megabase166,880,988 bp)。研究者將之分成九段來分析,也就是有8個間斷(gap),其中七個是在中心體及染色體端點附近的高度重複序列區(highly repetitive region)。據估計,六號染色體的真染色質(euchromatin)有99.5%已經完成定序工作。

在六號染色體166 megabase的序列中,可以找出2,190個基因結構(gene structure),其內含有772個已知基因(known genes),287新基因(novel genes),213新轉錄區(novel transcript),285可能基因(putative genes)以及633偽基因(pseudogene)。已知的基因中61%具有CpG island。若不計偽基因,則六號染色體的基因密度(gene density)為9.2gene/Mb,此數值雖與基因體整體的比例相近,但扣除Major Histocompatibity Compex (MHC) 43gene/Mb)則六號染色體的基因密度其實不高。不含偽基因的話,則基因部分約佔六號染色體的42.2%70,396,075 bp),平均基因長度為31,195 bp,外顯子(exon)則佔2.2%(平均281 bp)。每一基因的轉錄(transcript)平均為2.34 putative gene不計),其中FYN oncogene有高達16個轉錄。

六號染色體的一大特色是它具有人類最大的不轉錄蛋白質RNA gene non-protein-coding RNA gene)。在人類616tRNA基因中有157個位於六號染色體短臂(6p),除Ans-tRNACys tRNA外,所有的tRNA品類幾乎全在這裡。研究也發現tRNA 基因所在的位置亦是染色體上轉錄活動旺盛的區域(transcription hotspots)。這種位置重疊(colocalization)顯示轉錄工作啟動後染色質的構組會有大尺度(multi-Mb)的變動,亦即染色體的空間位置變動確是影響基因活性的重要因素(chromosomal location matters)。

六號染色體的反覆序列(repeat sequence)約佔43.95%,接近平均值。其中LINE20.85%SINE11.29%LTR 8.05%Retrotransposon 3.24%。在六號染色體短臂端(6pter)有17個連成一串的Alu序列,顯示此區為基因體的高度複製區域(duplication)。由於Alu重覆序列容易導致染色體異常的一再發生,6pter也真的與一些染色體重組(rearrangement)所致的疾病如glaucomaorofacial cleft palate以及腫瘤有所關聯。     

在六號染色體上有兩個大的複製區(duplication),即6p21.316p11.1。此外還有65個基因群(gene clusters),分屬46個基因家族(gene families),主要的基因群均位於6pMHC延伸區。事實上,六號染色體已定義的1557 基因中有22314.3%)似乎是起源於局部的複製(local duplication)。

六號染色體定序工作最大的特色就是同時與五種生物的基因序列比對;包括小鼠(Mus musculus)、斑點綠色河豚(Tetraodon nigroviridis)、大鼠(Rattus norvegicus)、河豚(Fugus rubripes)及斑馬魚(Danio rerio)。六種生物(含人類)相互比較下來發現有5,409個保留區(conserved region),其中5,204個與4,466個已定義的外顯子相符,這表示95.6%4466/ 4466+205)的轉錄外顯子已被定義出來。由於這種與其他生物基因序列比對的方便,使六號染色體的基因定義工作更加順利與確實。

迄今為止,六號染色體上共發現有183,019SNPsingle nucleotide polymorphism),其中2,761個在蛋白質轉錄外顯子。當然六號染色體最具多形性的基因是HLA-B86 SNP/kb)上,這也是整個人類基因體中多形性的冠軍,次為其他的class Iclass II基因,HLA-B目前已知有511allele

目前,六號染色體上有130gene已知和疾病有所關連,而其中84個已被轉殖出來(cloned)。MHC gene與自體免疫(autoimmunity)最有關連,至少有100種疾病被報告與MHC基因相關。HFE基因之突變會導致hereditary haemochromatosis。在神經疾病方面,六號染色體上有SCA1,其突變會導致spinocerebellar ataxia EPM2A Lafora’s myoclonus epilepsy有關,而PARK2的突變或缺損(deletion)則導致juvenile-onset autosomal recessive parkinsonism6p22上面的dysbindinDTNBP1)基因可能與schizophrenia有關。近來經由對平衡轉位t6:11)(q14.2:q25)之仔細分析顯示6q14.2HTR1E基因及11q25上面的B3GAT1schizophrenia-like psychosis有關。對染色體斷點(break point)的分析結果顯示這二個基因並未被切斷,因此可能是轉位之後,位置之不同而導致其功能失常,也就是position effect6q24上的PLAGL1HYMA1imprintedpateranlly expressed gene,研究顯示這兩個基因可能與transient neonatal diabetes mellitus(TNDM)有關。六號染色體上另外一組imprinted genes則位於6q26,此區據信是有tumor suppressor gene(TSGs)存在。

六號染色體長臂素來是遺傳學家注意的焦點,因為其上的基因與許多實體及血液腫瘤的進行有關。近來有人將六號染色體定序工作所得的clone製成array,來探討astrocytic glioma組織內的commonly deleted and/or homozygous deletion,這是搜尋tumor suppressor gene的新途徑。

總結而言,六號染色體的仔細分析及定義有幾個特色:

1. 藉由與其他生物基因體基因序列的比對,基因定義(annotation)的工作更為精確而有效率。

2. 六號染色體上的HLB-A是人類多形性最高的基因。

3. 六號染色體上有最大的tRNA clusters

目前還有兩個大計劃在進行,以加速揭開基因體的奧秘;其一是ENCODE (Encyclopedia for DNA Elements),另外則為MGC (Mammalian Gene Collection)ENCODE是取人類基因體序列的百分之一(3x10 7 bp),進行徹底的分析與比對,以決定其中所有的功能元素(functional elements),以編成一部基因序列導覽書,進而將之用於其他99%基因體序列的分析。ENCODE包含基因序列上的protein codingnon-protein coding區段以了解後者對其他基因之調控功能。MGC則希望對人類、小鼠及斑馬魚的每一個基因獲得至少一個全長的mRNA transcript,以求知曉基因被spliced之後的全貌。當然這些mRNA clone可以在細胞系統內進行其功能評估,以了解個別基因的功能。

     六號染色體分析完成後,還有17個人類染色體有待努力,在24個染色體全部分析及定義完成後,加上ENCODEMGC計劃,我們對整個人類基因體的掌握可望跨入一個新天地。

 

 

推薦讀物

1. Mungall A. J. et al: The DNA sequence and analysis of human chromosome 6. Nature 425:805, 2003.

2. Grimwood J et al: Six is seventh. Nature 425:775, 2003.