
【大數(shù)據(jù)的主要特征是什么 什么是大數(shù)據(jù)時代】
01.什么是大數(shù)據(jù)?數(shù)據(jù)是對客觀事實進行記錄的一種符號,可以是數(shù)字、文字,也可以是圖片、音頻、視頻 。大數(shù)據(jù)是指無法在一定時間范圍內(nèi)用常規(guī)軟件進行捕捉、管理和數(shù)據(jù)的數(shù)據(jù)集合 。
大數(shù)據(jù)具有"5V"特點,即數(shù)據(jù)量大、數(shù)據(jù)多樣性、價值密度低、增長速度快、數(shù)據(jù)質(zhì)量低 。
大數(shù)據(jù)時代強調(diào)數(shù)據(jù)的全部,而不是局部的樣本數(shù)據(jù) 。由于大數(shù)據(jù)的價值密度低,我們要接受這種模糊和不精確性 。通過對數(shù)據(jù)的研究,發(fā)現(xiàn)以前不曾發(fā)現(xiàn)的聯(lián)系,而不是像小數(shù)據(jù)時代,先通過假設(shè),然后再用數(shù)據(jù)來驗證 。也就是說,在大數(shù)據(jù)時代,對相關(guān)性的重視程度要強于因果性 。
02.什么是結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)?結(jié)構(gòu)化數(shù)據(jù)是適合用二維表格展現(xiàn)的數(shù)據(jù) 。每一行是一條記錄,每一列是不同的字段 。
以電商網(wǎng)站為例,用戶信息就可以用結(jié)構(gòu)化數(shù)據(jù)來存儲 。每位用戶就是一條記錄,而每位用戶又有姓名、性別、地址、手機、郵箱等字段,這樣就形成了一個二維表格 。

非結(jié)構(gòu)化數(shù)據(jù)不適合用二維表格來展現(xiàn),比如文檔、圖片、音頻、視頻等 。非結(jié)構(gòu)化數(shù)據(jù)的格式多樣,難以標準化和理解,因此在存儲、檢索、利用上都需要更加有效的方法和技術(shù) 。
03.什么是數(shù)據(jù)庫?數(shù)據(jù)庫從字面意思來看就是存儲數(shù)據(jù)的地方,但數(shù)據(jù)的存儲不是雜亂無章的,而是按照一定的規(guī)則來存儲的,具有可共享和便于管理的特點 。數(shù)據(jù)庫被視為電子化的文件柜 。用戶可以對數(shù)據(jù)庫中的數(shù)據(jù)進行增、刪、改、查等操作 。
數(shù)據(jù)庫可分為關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫、數(shù)據(jù)倉庫等類型 。
04.什么是關(guān)系型數(shù)據(jù)庫?關(guān)系型數(shù)據(jù)庫是指使用關(guān)系模型來組織數(shù)據(jù)的數(shù)據(jù)庫 。關(guān)系模型可以簡單理解為二維表格模型,以行和列的形式存儲數(shù)據(jù),因此適合存儲結(jié)構(gòu)化數(shù)據(jù) 。關(guān)系型數(shù)據(jù)庫就是由多個二維表格及其之間的關(guān)系組成的數(shù)據(jù)庫 。
常見的關(guān)系型數(shù)據(jù)庫有MySQL、SQL Server、PostgreSQL、Oracle等 。
以電商網(wǎng)站為例,除了用戶信息之外,還要記錄產(chǎn)品信息和訂單信息 。為簡化起見,每個訂單只包含一種產(chǎn)品 。產(chǎn)品包括名稱、價格、圖片、介紹等字段,訂單包括所屬用戶、相關(guān)產(chǎn)品、訂購數(shù)量、訂單價格、下單時間等字段 。一個用戶擁有一個或多個訂單,而一個產(chǎn)品也會屬于一個或多個訂單,這樣就建立了用戶、訂單和產(chǎn)品之間的關(guān)系 。

05.什么是非關(guān)系型數(shù)據(jù)庫?相對關(guān)系型數(shù)據(jù)庫而言,非關(guān)系型數(shù)據(jù)庫拋棄了固定的二維表格結(jié)構(gòu),存儲機制靈活,比如鍵值對、文檔、圖形等格式都可以進行存儲 。
常見的非關(guān)系型數(shù)據(jù)庫有Redis、MongoDB、Cassandra等 。
性能是非關(guān)系型數(shù)據(jù)庫最大的優(yōu)勢 。由于關(guān)系型數(shù)據(jù)庫中的關(guān)系模型會占用掉90%的硬件資源及計算時間,對于有大量不需要關(guān)系功能的數(shù)據(jù)處理,非關(guān)系型數(shù)據(jù)庫的性能是非常高的 。
另一方面,正是由于缺少數(shù)據(jù)表之間的關(guān)系,非關(guān)系型數(shù)據(jù)庫很難在多個表之間做非常復(fù)雜的數(shù)據(jù)查詢 。
06.什么是時序數(shù)據(jù)庫?時序數(shù)據(jù)庫是一類特殊的非關(guān)系型數(shù)據(jù)庫,全稱是時間序列數(shù)據(jù)庫 。經(jīng)研究發(fā)現(xiàn),機器設(shè)備、傳感器、系統(tǒng)日志等產(chǎn)生的數(shù)據(jù)有如下明顯的特征:
數(shù)據(jù)是時序的,即按照一定時間順序生成;
推薦閱讀
- 糖炒栗子里面的黑色顆粒是什么
- 足球里面的德比 德比什么意思
- 適合pubg的免費加速器 絕地求生什么加速器好
- besos besos是什么意思
- 保險送的代駕怎么使用
- 為什么家里的網(wǎng)連上卻不能用
- 幾種家常菜的正確煮法
- 經(jīng)典的湖南菜式
- 教你如何做出好吃的豬肝
- 枇杷能生津
