什麼是大數據,大數據的定義又是什麼?

生活問題百科知識


大數據

又稱巨量資料,指的是所涉及的數據資料量規模巨大到無法通過人腦甚至主流軟件工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊

簡而言之,大數據就是數據量非常大、數據種類繁多、無法用常規歸類方法應用計算的數據集成。大數據的收集、開發和利用,已經成為了當今社會的潮流之一,人們都認為,對於大數據的分析應用,對於政府和企業的決策是非常積極的,影響也是非常深遠的。

大數據的採集、發掘與處理

大數據的採集與發掘與雲計算是離不開的,與龐大的服務器空間也是分不開的。而現在的傾向就是租用雲計算平臺進行大數據的整理運用,簡單快捷,還不佔地方。

大數據的應用

一切皆可以大數據。

將人們所收集的各種數據分類彙總,最終通過高精尖的平臺運算,分析其中的規律所在,就是大數據的應用。如果數據收集得當,任何行業、任何事情都可以運用大數據尋找規律,最終做出最優的小抉擇。無論從公司營銷、政府決策、高速公路運營、農場管理、來年預算等等,大大小小的事情都可以應用大數據,並且從中獲利。

大數據的前景

大數據的前景並不僅僅是某一個行業的前景,一句話以蓋之——大數據時代已經來臨,並將從根本影響人類的生活。


鎂客網


我本身是做大數據行業的,根據我個人的經驗,通俗的,簡單的總結以下幾點吧

  1. 大數據,這個概念來說的話,我認為就是一套工具,一套過程,或者說一套方法論。

  2. 大數據,顧名思義就是數據量要大,這是前提,要有數據積累,要有數據沉澱,而且數據維度越多越好,數據深度越細越好,因為只有數據越深越細,才能釋放更多的價值。

  3. 大數據,概念很大,很先進,不可否認,目前在行業內,有很多公司或個人打著大數據的幌子做著偽大數據的事情。

  4. 大數據,簡單、通俗地講,就是整合各種各樣的數據,利用數據,溝通數據建模,或數據加工,或數據二次評價,讓數據換髮新的活力,在海量數據中挖掘出數據隱藏的、未被開發的價值,將數據應用到生產生活中,我個人認為可以將大數據分為政府大數據,和社會大數據。

  5. 政府大數據,就是說存儲在當前各級政府內部的數據,中國百分之80的,有高價值的數據基本都是在政府內部,儘管目前國家在鼓勵大數據產業發展,提倡陽光政府,提倡數據開放共享,但各級部門目前都將數據看做是權力的象徵,各級部門之間,部門內各科室之間的數據孤島現象非常嚴重,突破難度很大,在沒有國家更高一級的層面上支持的話,徹底打造陽光政府是很難做到的。

  6. 社會大數據,就是說大數據應用在民用,商用,這部分目前在中國發展的如火如荼,騰訊、阿里巴巴、滴滴、今日頭條、百度等巨頭都應用得非常非常好,舉個最簡單的例子:百度地圖導航,正是基於在海量的交通數據、地理位置數據、衛星數據、實施道路數據的前提下,對數據進行整合融合,通過對數據建模,研發出導航應用,每一次導航的體驗,都是大數據深刻應用的最好體現。

  7. 大數據,從抽象宏觀上,可整體分為數據採集、數據清洗、數據過濾、數據轉換、數據重載(統稱數據ETL),數據處理、數據管理、數據資源目錄、數據共享、數據開放、數據交換、數據應用等。


就愛玩數碼


大數據是一個術語,它描述了大量的數據 - 無論是結構化的還是非結構化的。可以通過分析大數據以獲得更好的決策和戰略業務動向。

當前的普遍共識是,大數據具有幾個屬性來標識。在大多數大數據圈中,常常用4V:數量(VOLUME),種類(VARIETY),速度(VELOCITY)和準確性(VERACITY)作為大數據的屬性,這一說法最早是由IBM的數據科學家提出的。近年來,第五個V- 價值(VALUE)也被提出作為新加的一個屬性。


數據量(VOLUME) - 描繪了數據的規模

使數據“大”的主要特徵之一數量。信息總量每年在呈指數增長。在2010年,湯森路透在其年度報告中估計,它相信世界“EB級別 的數據在不斷增長。”(1EB=1024PB;1PB=1024TB; 1TB=1024GB; 5 Exabyte相當於至今全世界人類所講過的話語)


數據種類(VARIETY)- 描繪數據的多樣性

數據種類和來源越來越多樣化,包括各種結構化的數據、非結構化的數據、半結構化的數據。來源從傳統的關係型數據庫中的表格數據,擴展為文本數據、網絡日誌、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。


準確性 (VERACITY)- 描繪數據的可信度

準確性是指數據的質量,可以信賴的程度。收集、分析的數據能否代表真實業務情況?每位優秀的管理者都知道,收集到的所有數據都存在固有的差異。


速度(VELOCITY) - 描繪數據變化的頻率

速度表現為數據增長速度快,處理速度要求也快,時效性要求更高。目前,大數據的交換和傳播是通過互聯網、雲計算等方式實現的,遠比傳統信息傳播速度快的多, 因此,對處理數據的響應速度有更嚴格的要求。許多業務都需要實時或者近實時的分析能力!


價值(VALUE) - 描繪數據的意義

現實世界中的數據中,有價值的數據所佔比例很小,至少容易挖掘出的有價值的數據比例很小。任何大數據項目的最終目標應該是為公司進行所有分析創造某種價值。否則,你只是為了技術而完成一些技術任務。


【關注ABC(A:人工智能;B:BigData; C: CloudComputing)技術的攻城獅,Age:10+】


樂之天空


大數據

大數據是指收集了海量的各種信息的集合,計算機上是指用單臺計算機軟硬件設施難以採集、存儲、管理、分析和使用的超大規模的數據集。大數據具有規模大、種類雜、快速化、價值密度低等特點。大數據的“大”是一個相對概念,沒有具體標準,如果一定要給一個標準,

那麼10-100TB通常稱為大數據的門檻。

大數數據的作用

什麼時候需要大數據,我們可以從下面這幾個方面去了解,方便你深入瞭解大數據。

  • 數據分析


通過自身的產品為目標用戶群提供支持或服務,而用戶在使用產品或服務過程中產生的交互、交易,都可以作為數據採集下來。收集這些數據,通過分析的手段反推客戶的需求,創造更多符合需求的增值產品和服務,重新投入用戶的使用,從而形成形成一個完整的業務閉環。這樣的完整業務邏輯,可以真正意義上驅動業務的增長。

  • 商業決策

大數據最有意義的方向是商業決策,通過數據來判斷應該做什麼。而商業數據分析的目的,就是商業結果。當數據分析的產出可以直接轉化為決策,或直接利用數據做出決策,那麼這才能直接體現出數據分析的價值。

-----------------------------------

本人現處廣州從事互聯網工作多年,資深技術人員、管理人員。願結識有互聯網業務的技術人員或企業人員、或有想法的創業人員


程序員的一些事




但什麼是大數據呢?大數據是指在一定時間內用軟件工具對其內容進行抓取、管理和處理的數據集合。大數據技術,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。適用於大數據的技術,包括大規模並行處理(MPP)數據庫,數據挖掘電網,分佈式文件系統,分佈式數據庫,雲計算平臺,互聯網,和可擴展的存儲系統。



通俗一點說就是我們在互聯網的各種行為被我們使用的APP或其它軟件記錄下來,並加以分析整理,甚至很多時候會和我們的真實身份聯繫到一起。這就是大數據,“便利”了我們,也讓我們更加透明!



大數據的定義:“大數據是使用新型的信息處理方式對大量的信息進行高速及時的整理分析去促成更強的決策能力、洞察力與最優化處理。”



明白的糊塗先生


大數據,按目前通俗意義上來講,就是各互聯網企業通過自己的應用APP所記錄的受眾人群的信息彙總總和。主要的目的是通過後期數據分析與發掘來確定企業的不足和發展方向。通過深入分析數據以推出最適宜的產品,以最少的成本獲得最大的利益。



其實吧,個人覺得這只是狹義上的理解,真正的大數據應當是人類文明發展至今的文明產出總和,這是一個龐大的工程,非一人之力也非一朝一夕倉促可成,不過歷史的發展似乎給了今人以時機和能力。

古代帝王在自己條件有限的情況下尚可清有《四庫全書》,明有《永樂大典》。再往前推,各類數據浩如煙海,不再贅述。橫向看世界更是名目繁多,璨若星河。



為什麼要有大數據,不僅僅在於記錄過往的輝煌,更多寄希望於通過通鑑歷史,規範前行。大數據的應用,不應當是企業的,保守的,小範圍局部的,應當是普惠全人類的。不要是“牆外行人,牆裡佳人笑”。



外行之言,大家莫笑。


不是英雄莫流連


大數據(big data),指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

對於“大數據”(Big data)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力範圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特徵。 大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的“加工能力”,通過“加工”實現數據的“增值”。

從技術上看,大數據與雲計算的關係就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須採用分佈式架構。它的特色在於對海量數據進行分佈式數據挖掘。但它必須依託雲計算的分佈式處理、分佈式數據庫和雲存儲、虛擬化技術。隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關係型數據庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。

大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)數據庫、數據挖掘、分佈式文件系統、分佈式數據庫、雲計算平臺、互聯網和可擴展的存儲系統。


互聯網少俠


中文名:大數據

英文名:big data

別 稱:巨量資料

提出者:維克托·邁爾-舍恩伯格

特點:大量、高速、多樣、價值

應用學科:計算機



有人把數據比喻為蘊

藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,

大數據並不在“大”,而在於“有用”。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是成為贏得競爭的關鍵。



2015年9月18日貴州省啟動我國首個大數據綜合試驗區的建設工作,力爭通過3至5年的努力,將貴州大數據綜合試驗區建設成為全國數據匯聚應用新高地、綜合治理示範區、產業發展聚集區、創業創新首選地、政策創新先行區。


一生一世_798


大數據分析對我們的生產生活帶來很多便利,同時制約者我們更好的貼近生活,遵循自然法則。


分享到:


相關文章: