在這個網頁裡 有我最新發表的文章與相關最新消息!
自從公元兩千年,人類基因體解碼之後,分子生物學進步神速,美國國家衛生研究院NCBI基因圖譜資料庫的建立,催化了生物資訊的進展與演算法的改良。
從後基因體時代,蛋白質體學與結構生物學的開發,人類對藥物、基因、生物化學與藥物化學的密切結合,產生了不可思議的連結!由於每個人的基因特質不同,可以準確的預測與預防疾病。當疾病發生時,亦可以準確地治療相關疾病,因而產生精準醫學的範疇。加上電腦機器學習與深度學習的配合,故有人工智慧的誕生。
目前或在不久的將來,將是以計算生物醫學工程為主題,結合當代生物資訊與傳統物理化學的演算方式,分析與預測未來在計算生物醫學工程的前景與展望。而生物資訊的領域,則是被涵蓋-甚至是被擴大了!除了是生物與資訊相結合之外,未來的生物資訊專家,除了分子生物學與資訊工程學這些必要的知識之外,還要涵蓋生物化學專家與藥學專家所知道的知識,還有就是物理化學-這門重要且久被遺忘的專業學問作為基礎才行!
於本文之中,以深入淺出的方式,介紹生物資訊學的發跡、發展與現況。期望給認識與關心生物資訊發展與應用開發的人,一個較為廣泛與深刻的了解!
生物資訊的開始與興盛,主要是從公元兩千年,人類之基因體解碼之後,為了處理大量產出之人類染色體中的基因體複雜與特殊的序列和規律,應運而生的一門新興的學問!從公元兩千年至今,也已經經過二十年的光景!
在一般絕大部份的教科書中所提到的歷史經過與編排上,首章通常是提到當年1960年代最重要的分子細胞生物學的歷程-華生與克力克發現了DNA的雙股螺旋!雙股螺旋的ATCG四個鹼基互對與半保留的基因複製轉錄轉譯,而產生的Central Dogma- DNA RNA Protein的轉錄與轉譯,為開宗明義第一章!然而在真正歷史上的發現與發展,則並非完全如此。
在歷史上的生物化學記載-早於一百年前,德國的生物化學工業,對於酵素的徹底研究,已經開始了!德國的生物化學和生物製劑,是舉世聞名的!德國的註明公司拜耳-對於製藥與皮革業等化學工業與染劑早已聞名於世!德國人對肝臟的解毒機制以及人體的生化與藥物代謝機制-ADMET(Adsorption, Distribution, Metabolism, Excretion, Toxicology) 也許多詳盡的描述!這些人體中重要的酵素-也就是現今所謂的蛋白質體受器,也就是現在的蛋白質體學與結構生物學的範疇!所不同的是,早期對於蛋白質的結構與酵素的詳細結構並非十分了解,只是針對重要的官能基-也就是所謂的Functional Group 有詳盡的描述!而對整塊大型蛋白質-也就是數以千計的氨基酸序列所組成的巨大案白質體分子結構描述不是像當今的PDB (Protein Data Bank) 寫得如此清楚而圖文並茂!只是由簡單的功能性胺基酸的串接,做為一個比較完整清楚地敘述而已!
所以:各位若回想一下先前所修的生物化學教科書,開宗明義第一章就是那二十來種的氨基酸結構-分為偏酸性、偏鹼性與輔酶等等,結構分析條理分明!而所授課的教師,常常要求學生們背誦二十多種基本胺基酸的詳細結構而遭學生們怨聲載道!然而,基本胺基酸的結構與功能,的確是深深地影響蛋白質的結構與功能和作用!這也就是許多教生化的老師一再強調的重要概念,希望學生如實背誦基本胺基酸的結構和PH值、親水、疏水性等本質的重要原因了!
然而,曾幾何時,電腦視覺化的快速開發,使同學們深深地迷上了生動活潑的蛋白質結構立體圖-甚至是活蹦亂跳的蛋白質立體結構模擬圖:生動有趣的動畫與富的結構吸引著學者與學生,反而看起來土裡土氣的氨基酸基本結構與分子間的作用力逐漸地令人淡忘掉了,甚至很少提起,只有在論文結果與討論分析時回味一下罷了!這樣的分子生物學學習系統與結果,亦憂亦喜-喜的是我們現今對蛋白質結構圖像化與分析十分徹底;憂的是我們對基本胺基酸的結構與生物化學最基礎的物理化學作用基本功已經逐漸退化掉了!
無論如何,時代的發展與演進是我輩無法掌控且只能順其自然,順水推舟的向前邁進了!話又說回來,當今細胞分子生物學的研究,大部分的研究學者還是側重基因體學,比較少對蛋白質體學上有所著墨!畢竟,學術是朝向新穎性(Novel) 的方向來進行的!若非是創新的發現,或是創新性不足,是無法發表在高點數的期刊上的。所以,關於細胞的基因剪輯CRISPR等等相關的學問,還是脫穎而出而榮獲諾貝爾獎的殊榮。當然,生物資訊這門創新性的學問,也是脫穎而出的。畢竟,他至今也只有二十歲而已!
Chapter2: 生物資訊的起手式-相似性比對 (Similarity Analysis)
醉裡挑燈看劍,夢回吹角連營。
八百里分麾下炙,五十絃翻塞外聲,沙場秋點兵。
馬作的盧飛快,弓如霹靂弦驚。
了卻君王天下事,贏得生前身後名,可憐白髮生!
宋 辛棄疾 《破陣子》
人類之基因體解碼之後,接二連三許多生物物種相繼問世了!為了蒐集比對這些基因體序列,美國國家衛生研究院建立最出名的資料庫-NCBI資料庫,來記載這些重要且複雜的基因體以及蛋白質體等等的資料庫!我們常戲稱NCBI資料庫有如中國的康熙大字典與所謂的四庫全書等等,資料完備且功能強大!有了這些重要物種的資料庫,科學家第一步想要知道的是:我們跟猩猩和猴子基因到底差多少?身為萬物之靈的人類,是否有大為優於其他眾生呢?結果讓人大吃一驚的是:我們和猩猩差不多!在相似性比對上,人類必須謙虛地面對眾生以及所有的生物:所有的生物DNA都是ATCG四種基本的鹼基對編織而成的!在上帝創造萬物時,其基礎本來平等!然而,相似性的比對,其資料庫與演算法的互相配合情況下,產生了許多延伸的議題和研究的題材!除了生物多樣性的分類與分群方式外,就是對人類基因體學有更進一步的徹底了解。
一個人若有先天的遺傳性疾病:或許是小腦萎縮、或者是肌肉無力症、或許是退化症,甚至是可怕的癌症,都與基因體有關!在這個又驚又懼的結論前提下,有許多開發工具以及應用軟體相繼問世:有許多相似性比對的網站或是演算法如「雨後春筍」的冒了出來!我想,用「雨後春筍」這四個字並不為過!各位若常上網查詢這類的論文甚至專書推薦網站,在2000年至2005年幾乎佔掉大部份的Bioinformatics Journal的篇幅!BLAST 這類的工具和論文真如「雨後春筍」是不足為奇,甚至是有過之而無不及的!就如剛開始有搜尋網站,如Yahoo、 蕃薯藤、 乃至於後來的Google搜尋網站問世時,那種方便與快速,令人深深地難以忘懷!只要鍵入關鍵字,就能從數以萬筆的網站資料中找到自己的名子所載的各種資料!在相似性比對上也是如此-只要輸入一串未知是何生物的基因體片段之後,電腦就會從NCBI資料庫調出相關的物種序列,很快地告訴你,那未知的生物是何種細菌、微生物、還是病毒!這在公元2003年所發生的一件大事上,產生了很大的貢獻!那就是SARS病毒基因快篩檢測!
SARS 也就是非典型肺炎,在SARS病毒發作,初期和一般流感發燒並沒有甚麼兩樣,然而經過兩三天之後,其病情逐漸惡化,致死率極高,且不好控制!最好的方式,就是隔離治療。如何在短時間就可以偵測出病患是否染上SARS病毒,最簡單的就是基因檢測!也就是PCR primer design 和比對,使SARS病毒無所遁形。在早期發現、其隔離病患並接受正確的藥物治療,是成功的一大要素!在國家衛生研究院多位同事的共同努力之下,以 Primer Design Assistant 為題,架設網站與資料庫比對,成功完成Primer 的引子設計,對台灣防疫做出一個具體的貢獻!
當然,這類的快速比對,在現今的生物資訊上已經不足為奇了!用基因檢測與快篩機制,用來判斷遺傳疾病與商品化的公司其實是越來越多了。許多先進的兒科或婦科診所,都有配合做基因檢測與快篩來判斷罕見疾病等病症的預測,而且收費並不便宜!由於現今對基因的研究十分深入且透徹,而且準確率高,深獲大眾的信賴與喜愛!而這類的計算模組與資料庫、演算法一樣受到社會大眾的喜愛與廣為應用。
生物資訊與程式設計
課程內容介紹
自從公元兩千年,人類基因體解碼之後,分子生物學進步神速,美國國家衛生研究院NCBI基因圖譜資料庫的建立,催化了生物資訊的進展與演算法的改良。
從後基因體時代,蛋白質體學與結構生物學的開發,人類對藥物、基因、生物化學與藥物化學的密切結合,產生了不可思議的連結!由於每個人的基因特質不同,可以準確的預測與預防疾病。當疾病發生時,亦可以準確地治療相關疾病,因而產生精準醫學的範疇。加上電腦機器學習與深度學習的配合,故有人工智慧的誕生。
目前或在不久的將來,將是以計算生物醫學工程為主題,結合當代生物資訊與傳統物理化學的演算方式,分析與預測未來在計算生物醫學工程的前景與展望。而生物資訊的領域,則是被涵蓋-甚至是被擴大了!除了是生物與資訊相結合之外,未來的生物資訊專家,除了分子生物學與資訊工程學這些必要的知識之外,還要涵蓋生物化學專家與藥學專家所知道的知識,還有就是物理化學-這門重要且久被遺忘的專業學問作為基礎才行!
於本課程之中,以深入淺出的方式,介紹生物資訊學的發跡、發展與現況。期望給認識與關心生物資訊發展與應用開發的人,一個較為廣泛與深刻的了解!
教學綱要/目標
本門課程之教學方式乃是以以投影片講義,摘錄出生物資訊學中常見之原理與常用之應用開發工具,以利學生在短時間內得以入門並能順利上手為原則。除此之外,並配合精準醫學與大數據資料庫等相關技術,以及對深度學習的淺介。
評量標準
5次心得報告(每次占總成績20%) 心得報告為上課之課程筆記整理 (大約A4 四至六頁 約2000字至3000字) 於moodle 上繳交
主題一: 何謂生物資訊?
教學目標
藉由三大生物資訊資料庫,介紹最早期的跨領域整合課程·生物資訊的原理、應用與歷史。
教學大綱
NCBI Database Structure;EBI Database Structure;DDBJ Database Structure