復旦大學大數據學院,大數據的研究及其應用

·當斯隆數字巡天(SDSS)在2000年開始收集天文數據時,它在頭幾周收集的數據比以前天文學歷史上收集的數據要多 。大數據可以對科研有以下幫助:·大型強子對撞機實驗代表約1.5億個傳感器每秒提供4000萬次數據 。
大數據在科研上的應用有哪些?

復旦大學大數據學院,大數據的研究及其應用


大數據可以對科研有以下幫助:·大型強子對撞機實驗代表約 1.5 億個傳感器每秒提供 4000 萬次數據 。每秒有近 6 億次碰撞 。經過篩選并避免記錄超過 99.99995% 的這些數據流后,每秒有 100 個目標的沖突 。因此,僅使用小于 0.001% 的傳感器數據流,來自所有四個 LHC 實驗的數據流在復制之前的年度速率為 25 PB(截至 2012 年) 。
復制后這將變成近 200 PB 。如果所有傳感器數據都記錄在 LHC 中,那么數據流將非常難以處理 。在復制之前,數據流量每年將超過 1.5 億 PB,或者將近 500 EBabytestes 。以數字來看,這相當于每天500 個字節(5×1020)字節,幾乎是世界上所有其他來源的 200 倍 ?!quare Kilometer Array 是由數千個天線構成的射電望遠鏡 。
預計到2024年將投入使用 ??偟膩碚f,這些天線預計將收集 14 EB 字節,并且每天存儲 1 PB 字節,這被認為是有史以來最雄心勃勃的科學計劃之一 ?!ぎ斔孤底盅蔡欤⊿DSS)在 2000 年開始收集天文數據時,它在頭幾周收集的數據比以前天文學歷史上收集的數據要多 。SDSS 以每晚 200GB 的速度繼續運行,累積了超過 140TB 的信息 。
【復旦大學大數據學院,大數據的研究及其應用】當 SDSS 的繼任者,大型綜合測量望遠鏡在 2020 年上線時,其設計人員預計它將每五天獲取一次該數據量 ?!そ獯a人類基因組原本需要 10 年 的時間來處理,現在可以在不到一天的時間內完成 。在過去的十年中,DNA 測序儀已經將測序成本減少了10,000,這比按照摩爾定律預測的成本降低便宜了 100 倍。

    推薦閱讀