日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

基因測序“黑科技” 給生命來個完整的“數(shù)字化解讀”


基因測序“黑科技” 給生命來個完整的“數(shù)字化解讀”



“測序技術(shù)抓住了生命科學(xué)技術(shù)的龍頭, 基因組測序成本從最初的3000萬美元下降到1000美元甚至更低, 使得每個人都可能為自己進行基因組測序, 這將加速生命數(shù)字化的進程 。 ”6月21日, 2019測序技術(shù)和應(yīng)用高峰論壇上, 中國科學(xué)院院士楊煥明表示, 在高通量測序技術(shù)自主化的基礎(chǔ)上, 不斷有新的“黑科技”跟進, 這使得人們將獲得更加準確的基因序列, 作為生命數(shù)字化的“藍本” 。
吐口唾液就能測序, 但基因組序列不完整
吐口唾液郵寄, 一個人的基因組序列就會得到分析 。
“目前從全世界范圍來講, 大概有接近2000萬人有自己的基因信息 。 ”華大智造首席運營官蔣慧表示, 隨著這些年測序技術(shù)的普及, 測序的門檻越來越低, 人們越來越容易對自己的基因進行部分測序 。
但并不是所有的測序都是獲得完整的基因組序列 。 蔣慧介紹, 大部分此類的測序是對特定區(qū)域的測序, 而并不是整個基因組序列的測序 。
如果將一個人的基因組比喻成一座奇峰險峻的高山, 可以理解為, 有些測序只是拍攝了“一線天”“巨石陣”“黑龍?zhí)丁边@些有代表性的景點;更完整地是, 有些測序是把所有的景點拍下來, 被稱為“功能基因集”;而完整的基因組測序才是把高山全部拍下來, 包括像荒草一樣叢生的“沙漠基因”或者“無功能基因”等 。
無疑, 要實現(xiàn)生命數(shù)字化, 需要的是把高山全部拍下來的完整的基因組測序 。
但目前的測序, 即便是基因組測序, 仍舊不能滿足生命數(shù)字化的需要 。 “目前無論是數(shù)據(jù)庫構(gòu)建, 還是群體研究、疾病研究, 都是采用重測序的方式, 是通過與參考基因組的比對獲得的, 而不是從頭組裝 。 ”蔣慧說, 比如在炎黃基因組研究項目中, 科學(xué)家找到了大概有4—5兆的區(qū)域是個體所特有的, 進行測序時就對個體區(qū)域比對, 形成測序數(shù)據(jù), 這是受測序效率制約的 。
可以理解為, 每一座高山的形狀、代表性景點都相似, 就先找了最具代表性的山做個詳細的“數(shù)字化解讀”, 描述其他山的時候, 就用差異來體現(xiàn) 。
“或許每個人擁有屬于自己的特點序列, 但目前的測序方式難以發(fā)現(xiàn)這些獨特部分 。 ”蔣慧說, 與參考基因組比較獲得的基因組測序“密碼”不會對這些未知謎題給出答案 。
從頭組裝, 完成整個基因鏈條的拼接
數(shù)字化生命實際上需要一個高清、完整的基因組作為“藍本” 。 這意味著需要高質(zhì)量地從頭組裝基因組 。
“目前最大的難點是獲得盡可能長的序列進行組裝 。 ”蔣慧說 。 如果單次測序讀長變長, 那么獲得從頭組裝基因組的難度就會降低 。
人類基因組長度為30億個堿基對, 而現(xiàn)在單次測序的讀長僅為50—70kb(5萬到7萬個堿基對的長度), 這猶如拼一副45000塊拼圖, 其中卻有很多重復(fù)相似的“小塊”, 很難拼接完整 。 不僅需要以參考基因組做對比, 還要反復(fù)測序 。 “目前的行業(yè)標準是需要30倍的重復(fù)測序, 以完成整個基因鏈條的拼接 。 ”蔣慧說 。
如果將短片段加上標簽就不一樣了 。 玩過拼圖的人都知道, 在成千塊的拼圖背面會有不同的區(qū)塊標記, 提示這些塊在同一區(qū)域 。
“以專有DNA分子共標簽技術(shù)為基礎(chǔ)的stLFR(單管長片段)技術(shù)就是基于這樣的原理 。 ”蔣慧說, 華大智造的這一自主技術(shù)通過將來源于同一DNA長片段的短讀長測序片段標記上相同分子標簽, 能夠基于高精度短讀長測序獲取長片段的DNA信息 。

推薦閱讀