中國科技經(jīng)費投入再創(chuàng)新高 R&D總支出逾4600億
一、我們將如何應對海量的基因信息
新一代測序技術帶給人們大量遺傳信息的同時,卻成為限制其廣泛應用的一個障礙。
1980年,英國生物化學家Frederick Sanger與美國生物化學家Walter Gilbert建立了DNA測序技術并獲得諾貝爾化學獎,至今已有近三十年了。在這三十年,DNA測序技術取得了令人矚目的進展。目前已進入市場的循環(huán)陣列測序平臺采用的是與Sanger生物化學測序方法完全不同的原理。在過去幾年,應用極為廣泛的毛細管電泳測序法采用的則是多線并行陣列格式,它運用尖端的熒光成像技術進行堿基識別。上述各類新技術為生物學研究領域開辟了新的視角,也使實驗研究達到一個新的水平。學界對開發(fā)這類新技術的興趣持續(xù)高漲,與此同時,人們卻發(fā)現(xiàn)這些技術存在一定的不足——大量信息數(shù)據(jù)的產(chǎn)生限制了技術更加廣泛的應用,并降低了其市場價值。
過去,研究人員使用Applied Biosystems(ABI)公司的3730XL毛細管電泳測序儀進行基因分析,每年至多能完成六千萬堿基的測序量。隨著測序技術日新月異的發(fā)展,這種情況已經(jīng)成為歷史。在2005年剛剛開始進行新一代測序技術開發(fā)時,Roche公司和454公司聯(lián)合開發(fā)的焦磷酸測序儀的分析速度就已經(jīng)達到了上述提及的ABI儀器速度的50倍之上。也就是從那時起,因基因數(shù)據(jù)過多而產(chǎn)生的問題凸顯了出來,而且這個問題隨著其他制造商開發(fā)出更多更快的測序儀而愈加嚴重。舉個例子,ABI的新一代測序平臺SOLiD(supported oligonucleotide ligation and detection)單次運行,便可以分析6Gb的堿基序列;而Roche/454測序儀單次運行可以將上述結果轉換成12-15個千兆字節(jié)(gigabytes)的數(shù)據(jù)信息;Illumina Genome Analyzer(GAII)測序系統(tǒng)僅在兩個小時的運行時間里,就得到10兆兆字節(jié)(terabytes)的信息。盡管對于像Applied Biosystems這樣的制造商而言,可以為用戶提供高達11.25TB的存儲量,但對于多數(shù)實驗室所具有的信息管理系統(tǒng)來說,規(guī)模如此龐大的數(shù)據(jù)信息,就好像是迎面而來的洪水,讓人感到難以控制。
過量信息所帶來的一個副作用在于,用戶無法將初始圖像數(shù)據(jù)進行分類存檔,而必須交給相關公司,利用軟件對數(shù)據(jù)進行讀取,然后才能對數(shù)據(jù)進行保存。對于大多數(shù)研究人員來說,像這樣在每次實驗后對原始數(shù)據(jù)進行處理的方式既繁瑣又不經(jīng)濟。與花費上萬美元對每一段序列進行備份分析相比,對每一次測序結果進行重新測定顯然是一個更簡單、更便宜的選擇。測序儀制造商稱,對原始數(shù)據(jù)再次進行分析并不能得到更多新的信息。但是,對于454測序儀而言,用戶至少可以通過更新的軟件從原始數(shù)據(jù)得到質量更高的序列,從而提高堿基識別分辨率,減少誤差。
除數(shù)據(jù)處理問題之外,研究人員還需要擁有一個足夠強大的計算機平臺,以便將來自多個測序技術的短小基因片段進行組合,形成基因組外顯子。目前問題在于,測序儀生產(chǎn)商僅僅提供用于某些特定基因信息分析的軟件,如靶標重測序、基因表達分析、染色質免疫沉淀反應或基因組從頭測序等,而并未提供任何其它類型的下游生物學信息分析軟件。研究界越來越熟悉這些測序平臺對循證生物學的巨大潛力,這也就產(chǎn)生了新的研究問題以及全新類型的試驗方法,而這單憑依賴目前的生物學信息是無法滿足的。
從這個角度看,SOLiD軟件研發(fā)公司(http://solidsoftwaretools.com/gf/)于今年七月剛剛兼并了兩個新的軟件公司,這一舉動無疑朝正確的方向邁進了一步。該公司在開放源碼許可證下開發(fā)軟件分析工具,目的就是為了給生物信息學領域提供支持,并為其開發(fā)新的算法。
對用戶而言,如果能夠將數(shù)據(jù)格式與不同測序平臺獲得的結果進行比較所得的統(tǒng)計數(shù)字進行標準化,無疑具有重大的意義。特別是由于目前以測序平臺為核心的市場競爭激烈,因此每個生產(chǎn)商都努力提供最好的數(shù)據(jù)結果。
在這樣的大環(huán)境下,對數(shù)據(jù)及不同產(chǎn)品的比較結果進行標準化,便顯得尤為重要。有一個方法可以更好地對不同的新一代測序技術進行比較,那就是建立一個微陣列定性分析小組(Microarray Quality Control consortium),不僅可以對不同的技術結果進行比較,而且還可以將新技術結果與DNA微陣列或定量PCR進行比較。
綜合以上各類因素,可以預見的是,新一代測序平臺在近幾年內(nèi),仍然會局限于少數(shù)實驗室及研究者,而大多數(shù)缺少能夠對基因信息進行進一步分析的實驗室則無法從新測序技術中獲益。對大多數(shù)實驗室而言,即使新一代的測序平臺能夠提供更多的信息,DNA微陣列分析仍然是一個相對便宜的選擇。例如,在轉錄分析中,雖然新一代測序結果不僅能給出具有很大動態(tài)范圍的基因豐度信息,同時還可提供剪切變異信息以及SNP數(shù)據(jù),但是這些數(shù)據(jù)結果都需要進行不同的DNA微陣列分析才能獲得。
那么,有沒有什么方法可以解決這些問題呢?首先,相關的資金授予機構應該對生物信息學的發(fā)展予以與測序技術同等的關注;此外,由于生物信息學發(fā)展中的瓶頸已經(jīng)限制了測序機器的銷售,測序儀生產(chǎn)商也應該聯(lián)合起來解決這一難題。同時,制造商應該致力于制定以研究領域為基礎而不是以不同公司為基礎的生物信息學解決方案。
因此,如果新一代測序平臺真的能夠帶動基因組測序“普及化”——讓基因組測序從大型測序中心走入每個研究人員的實驗室或者小型研究小組,那么還需要研究人員付出更多努力,開發(fā)出經(jīng)濟實惠的分析軟件以及數(shù)據(jù)管理系統(tǒng)。目前的狀況是,與新一代測序技術相關的生物信息學分析工作僅僅掌握在少數(shù)人手里,但是這一具有重要價值的技術毫無疑問應該由大多數(shù)人掌握。如果數(shù)據(jù)處理問題不能得到有效解決,那么ABI公司的SOLiD系統(tǒng)、454公司的超高通量基因組測序系統(tǒng)——GS FLX、Illumina公司的GAII系統(tǒng)等新一代測序儀就永遠無法真正出現(xiàn)在能夠展現(xiàn)其價值的舞臺上。
國家統(tǒng)計局、科學技術部、財政部十二月十五日聯(lián)合發(fā)布二〇〇八年全國科技經(jīng)費投入統(tǒng)計公報稱,去年全國研究與試驗發(fā)展(R&D)經(jīng)費總支出為四千六百一十六億元人民幣,比上年增加九百零五點八億元,增長百分之二十四點四,投入強度再創(chuàng)歷史新高。
二〇〇八年,中國國家財政科技支出持續(xù)增加,科技經(jīng)費投入繼續(xù)保持穩(wěn)定增長,R&D經(jīng)費投入力度加大,與國內(nèi)生產(chǎn)總值之比為百分之一點五四,比上年的百分之一點四四有所提高。按研究與試驗發(fā)展人員(全時工作量)計算的人均經(jīng)費支出為二十三點五萬元,比上年增加二點一萬元。
分活動類型看,基礎研究經(jīng)費支出為二百二十點八億元,比上年增長百分之二十六點五;應用研究經(jīng)費支出為五百七十五點二億元,增長百分之十六點七;試驗發(fā)展經(jīng)費支出三千八百二十億元,增長百分之二十五點五。其中試驗發(fā)展經(jīng)費支出所占比重為百分之八十二點八。
九大行業(yè)R&D經(jīng)費投入強度(與主營業(yè)務收入之比)超過百分之一。其中專用設備制造業(yè)為百分之一點九三,醫(yī)藥制造業(yè)為百分之一點七四,通用設備制造業(yè)為百分之一點五九,分居前三;其他依次為電氣機械及器材制造業(yè),交通運輸設備制造業(yè),橡膠制品業(yè),通信設備、計算機及其他電子設備制造業(yè),儀器儀表及文化、辦公用機械制造業(yè),以及化學纖維制造業(yè)。
R&D經(jīng)費支出超過三百億元的有江蘇、北京、廣東、山東、上海和浙江六個省(市),共支出二千七百六十七點五億元,占全國經(jīng)費總支出六成;其中江蘇支出五百八十點九億元,高居榜首。R&D經(jīng)費投入強度(與地區(qū)生產(chǎn)總值之比)達到或超過全國水平的有北京、上海、天津、陜西、江蘇和浙江六個省(市),其中北京經(jīng)費投入強度百分之五點二五,高出次席的上海一半以上。
二〇〇八年,國家財政科學技術支出為二千五百八十一億元,比上年增加四百八十三點三億元,增長百分之二十二點二;財政科學技術支出占當年國家財政支出的比重為百分之四點一二。
- 【中國農(nóng)業(yè)儀器網(wǎng)】聲明部分文章轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,且不承擔此類作品侵權行為的直接責任及連帶責任。如涉及作品內(nèi)容、版權和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系。