放心吧,給你別人的數(shù)據(jù)還好說(shuō),給你猩猩的好容易看出來(lái)的
“基因70%相似”說(shuō)的是基因的功能相似,功能相似不意味著蛋白序列足夠相似;即使蛋白序列相似,DNA序列也會(huì)有很大差異——尤其是在基因間區(qū)、intron這些非保守的區(qū)域。為了維持基因組結(jié)構(gòu)穩(wěn)定(不會(huì)因?yàn)橹匾谋仨毣蚨紨D在一起使得隨隨便便的變異就造成整個(gè)物種分分鐘就掛了),以及滿足進(jìn)化的需求,高等生物基因組序列中冗余的序列是很多很多而且與必須基因(沒了就死)均勻分布的。保守序列的差異可以直接用作物種的鑒定(比如16s rDNA序列什么的)。而非保守區(qū)域的多態(tài)性較高,很容易在其中找到辨別個(gè)體差異的“barcode”,即“分子標(biāo)記”(比如snp什么的,一個(gè)人大概會(huì)攜帶300M個(gè)SNP),這些分子標(biāo)記也是用來(lái)做親子鑒定、犯罪鑒定的手段。我們大可以在其中找到與自己形狀相符的SNP來(lái)佐證數(shù)據(jù)是不是自己的(比如喝酒臉紅就去找醛脫氫酶的SNP,比如用Y染色體的SNP佐證自己的家族)。猩猩的話……不等你去找自己的SNP,光在比對(duì)的時(shí)候就會(huì)發(fā)現(xiàn)和人的基因組reference比不上的reads太多了(咳咳,別告訴我有錢買數(shù)據(jù),卻不知道要比對(duì))……
大不了花個(gè)99刀再測(cè)個(gè)23 and Me,看兩遍給出來(lái)的snp的genotype一不一樣就好了(當(dāng)然也可以找任意機(jī)構(gòu)設(shè)計(jì)幾個(gè)引物驗(yàn)證幾個(gè)SNP嘛)
PS,搞猩猩的樣本測(cè),比測(cè)你貴多了………………同一個(gè)測(cè)序數(shù)據(jù)給多個(gè)人,給的還是猩猩的話,還是挺有創(chuàng)意的呢