本所林仲彥老師團隊-「應用於精準醫學與智慧育種之基因體重組與品質評估整合平台」,榮獲科技部2021未來科技獎。
研究內容:
日新月異的生物序列次世代定序技術、單細胞基因分析、經濟作物的全基因體解析與個人化精準醫學等,將生物醫學研究推進至巨量資料層級,特別是個人的基因體組裝(正常與癌化組織),伴隨巨量生物序列的累積,將能揭露更多致病機制與提供未來治療的可能策略。
目前研究團隊透過手邊已有大量數TB的高品質的自產資料(包括次世代定序資料、第三代單分子定序及10x Genomics短片段標誌序列等),研發了新的混合組裝演算法。除了能在組裝前後進行序列的分析,也能動態地以遞迴(Spiral assembling)與多樣定序平台混搭的方式,來優化整個組裝的基因體,同時也能利用大量的10x Genomics短片段標誌序列,來重新組裝與修補在原有序列中的遺缺,以及透過組裝序列間的拓樸關係,來連結與修補可能相鄰的長序列大片段。目前在日本鰻、台灣鯛及個人基因體組裝上,已有相當不錯的進展,能大幅減少序列中的遺缺,並連結組裝片段,同時增加基因內涵。
在非模式物種方面,對於已有不同平台定序資料的之雛形基因體,我們已發展可動態組合的演算法,依其定序量與類型,來找出最佳的組裝方式。對於全新的定序計畫,我們則建議直接以三代定序為主,結合加上標誌序列的二代定序 (以10x Genomics所產出的短序列標誌連鎖組)與染色體構象Hi-C定序為輔,在考量定序成本與基因體覆蓋倍率的平衡下,利用所開發新一代組裝演算法模組,將可提供全新高品質基因體組裝新策略。基於前項的成功經驗,已有院內生多中心、台大、海大與台灣水產試驗所等團隊與我們接觸商討合作,並簽訂MOU,希望透過我們的經驗,來完成複雜的基因體解碼工作(如白蟻、海水台灣鯛、白帶魚及金目鱸等),作為後續基因體育種的重要基礎。
本研究之相關成果也陸續整理釋出程式源碼及建構Dockers images,放置在GitHub及 Docker Hub 上。組裝出來的經濟生物基因體,也透過研發團隊所建構的平台,進行註解與線上資料庫建構,將這一些非模式物種之基因體研究,提昇到如同果蠅或小鼠等模式生物的水準,協助相關研究社群進行更詳盡的研究。
此外,研發成果中的『人類與小鼠基因表現分析平台』,已與國內定序廠商合作。以技術授權的方式完成轉移威健生物科技股份有限公司,於2018年底開始商業試運轉。