03.05 大數據的含義和作用是什麼?

手機用戶58068186549


作為一名IT從業者,我來回答一下這個問題。

大數據經過多年的發展已經形成了一個龐大的技術體系和行業生態,關於大數據的定義也有了較大程度的拓展,當前大數據的含義也從數據層面嚮應用層面不斷髮展。

從當前的技術體系結構來看,大數據技術涵蓋了從數據採集、傳輸、存儲到分析、呈現和應用的一系列環節,大數據技術體系也正在從數據分析(基於大數據平臺)向數據採集和數據應用兩端發展,同時也出現了行業分工。所以,當前的大數據本身就代表了一個產業鏈,這個產業鏈的規模也將隨著大數據的落地應用而不斷髮展和壯大。

從大數據的應用層面來看,大數據正在開闢出一個新的價值空間,這是大數據之所以被廣泛重視的重要原因。大數據的價值空間非常大,基於大數據的價值空間可以完成大量的創新,而這些創新本身也將推動大數據全面與行業領域的結合。相信在工業互聯網的推動下,大數據技術的落地應用將全面促進行業資源的數據化,這會進一步提升數據自身的價值密度。

對於行業領域來說,大數據的作用可以從三個方面來解讀,其一是大數據會提升行業領域的管理能力,當前基於大數據的管理模式正在從互聯網行業向傳統行業覆蓋,關鍵點在於價值衡量體系的打造;其二是大數據能夠促進行業領域的創新,這個過程也會促進物聯網和人工智能等技術的落地應用;其三是大數據能夠為行業領域帶來新的價值增量,這個價值增量的空間還是非常大的,關於價值增量的描述可以基於數據來體現,也可以通過模式來體現。

我從事互聯網行業多年,目前也在帶計算機專業的研究生,主要的研究方向集中在大數據和人工智能領域,我會陸續寫一些關於互聯網技術方面的文章,感興趣的朋友可以關注我,相信一定會有所收穫。

如果有互聯網、大數據、人工智能等方面的問題,或者是考研方面的問題,都可以在評論區留言,或者私信我!


IT人劉俊明


大數據(英語:Big data),又稱為巨量資料,指的是在傳統數據處理應用軟件不足以處理的大或複雜的數據集的術語

大數據的特點

  • 體積大

數據量很重要。對於大數據,將不得不處理大量的低密度,非結構化數據。這可能是價值未知的數據,例如Twitter數據供稿,網頁或移動應用程序上的點擊流或啟用傳感器的設備。對於某些組織,這可能是數十兆字節的數據。對於其他人,可能是數百PB。

PB是硬盤存儲容量單位,存儲容量:是該存儲設備上可以存儲數據的最大數量,通常使用千字節(kb kilobyte)、兆字節(MB megabyte)、吉字節(GB, gigabyte)、太字節(TB ,terabyte)和PB(Petabyte)、EB(Exabyte)等來衡量。1PB=1024TB=1024 * 1024 GB一部1080P高清電影 2G 左右,大概就是 50W部高清電影
  • 速度

速度是接收和(或可能)作用於數據的快速速率。通常,與直接寫入磁盤相比,數據流直接進入內存的速度最高。一些支持互聯網的智能產品會實時或近乎實時地運行,因此需要實時評估和採取措施。

  • 多樣性

多樣性是指可用的多種數據類型。傳統的數據類型經過結構化,可以整齊地放置在關係數據庫中。隨著大數據的興起,數據進入了新的非結構化數據類型。非結構化和半結構化的數據類型(例如文本,音頻和視頻)需要進行額外的預處理才能得出含義並支持元數據。

  • 真實性

它是指數據中的不一致和不確定性,即可用數據有時會變得混亂,並且質量和準確性難以控制。

大數據也是可變的,因為多種不同的數據類型和數據源會產生大量的數據維度。

  • 價值

除非將其轉化為有用的東西,否則大量沒有價值的數據對公司沒有好處。

數據本身沒有用處或重要性,但需要將其轉換為有價值的信息以提取信息。

大數據作用

指引產品開發

Netflix和寶潔等公司使用大數據來預測客戶需求。他們通過對過去和當前產品或服務的關鍵屬性進行分類並對這些屬性與產品的商業成功之間的關係進行建模,從而為新產品和服務建立了預測模型。此外,寶潔還使用焦點小組,社交媒體,測試市場和早期商店推出的數據和分析來計劃,生產和推出新產品。

預測性維護

可以預測機械故障的因素可能深深地埋在結構化數據中,例如設備的年份,製造商和型號,以及覆蓋數百萬條日誌條目,傳感器數據,錯誤消息和發動機溫度的非結構化數據。通過在問題發生之前分析這些潛在問題的徵兆,組織可以更有效地部署維護並最大化零件和設備的正常運行時間。

提升客戶體驗

客戶競賽在進行中。現在比以往任何時候都更可能更清晰地瞭解客戶體驗。大數據使您能夠從社交媒體,Web訪問,呼叫日誌和其他來源收集數據,以改善交互體驗並最大程度地實現交付的價值。開始提供個性化報價,減少客戶流失並主動處理問題。

機器學習

機器學習現在是一個熱門話題。數據(尤其是大數據)是原因之一。現在,我們可以教授機器而不是對其進行編程。大數據的可用性可訓練機器學習模型,從而使之成為可能。

推動創新

大數據可以通過研究人員,機構,實體和流程之間的相互依賴性,然後確定使用這些見解的新方法來幫助您進行創新。使用數據洞察力來改進有關財務和計劃考慮因素的決策。檢查趨勢以及客戶希望提供什麼新產品和服務。實施動態定價。有無窮的可能性。

引申

現在社交媒體(微信,微博,短視頻),電商都有海量數據。頭條可以根據用戶行為進行精準推送內容或是廣告。電商可以根據數據推送有購買意向的產品。

當前大數據時代只要是有海量用戶,就可以根據用戶的行為進行分析從而衍生出新的價值信息。


人工智能的前提就是通過海量數據,進行模型訓練從而形成自己的計算方式。16年時谷歌人工智能機器人阿爾法狗大敗世界圍棋冠軍李世石。圍棋是人類引以為傲的高智商遊戲,但最終敗給了機器人。機器人就是前期通過海量數據進行計算不斷的完善。


大數據的快速發展,也帶來了很多問題。例如鼎鼎大名的臉書用戶隱私洩漏事件。大數據中含有很多用戶隱私數據,不正當的使用會造成災難事故。


大數據未來還可以在更多的領域中使用,未來也將會出現更多的技術彌補大數據的漏洞。



極客架構


大數據,英文名稱Big Data,這個很容易理解,字面上來說,就是大量的數據。這個大有好幾種含義:

1。數據量多。這種數據量超越了簡單應用裡的數據量,上億上百億的數據量,而且增量多,可能隨時會增加。

2.數據種類多。大數據不僅僅拘泥於年齡,姓名,身高這種簡單的數據,它包含你的上網偏好,地理位置,語音信息,圖片信息,視頻信息。只要是網上你能搜查到的信息都包含在內。

大數據應用軟件:

以前的關係數據庫處理上千萬條數據可能已經非常吃力,特別是超大量的數據,隨隨便便就幾個T,如果沒有數據庫的優化技術,難以勝任。目前大數據處理軟件包含主流的hibernet,spark等等,這種是基於文本類型來存儲的,讀取速度快,需要基於大內存。

應用實例:

最實用的應用是淘寶會根據你的上網記錄自動給你推薦商品,你搜了個手機,首頁上接著會出現好幾款最新手機供你選擇。

最搞笑的應用是淘寶曾經根據全國女性購買胸罩的記錄,測算了下全國女性乳房的大小,額,這個項目經理是不是有點怪癖。

最嚇人的應用是你現在上網的記錄幾乎都被記錄了,哪一天集成後你在網上做的任何事情都會被記錄。萬一信息被洩露,你就和透明人一樣,在其他人面前根本沒有秘密可言。




PPt小助手


隨著計算機技術、信息技術和人工智能技術的快速發展,諸多領域的數據都呈指數式增長,大數據的概念也由此引起了學術界和業界的關注。大數據被認為是未來技術最重要的領域之一,因為它可以為企業提供高價值信息。

從資源角度來看

大數據是基於雲計算等新處理模式才能快速捕獲、處理和分析的規模巨大,種類繁多和更替迅速的信息資源集合,可以增強預測精度以及提升決策能力。

從管理角度來看

大數據是一類能夠反映物質世界和精神世界運動狀態和狀態變化的信息資源,它具有複雜性、決策有用性、高速增長性、價值稀疏性和可重複開採性。從來源角度來看,大數據是從不同來源和不同格式收集的一組數據,是不同類型的企業和國家組織收集的大量無序數據的集合。

從形式視角來看

大數據是工業傳感器、互聯網、移動數碼等固定和移動設備產生的結構化、半結構化與非結構化數據的總和。而且大數據通常具有 Volume(體量大)、Variety(多樣性)、Velocity(速度快)、Value(價值密度低)、Veracity(真實性),以及 Volatility(波動性)和 Variability(可變性)的 7V 特徵。有學者從動態的角度認為大數據有 Cover(廣泛覆蓋)、Contact(複雜聯繫)、Cause(豐富來源)、Convey(多元傳遞)的 4C 特徵。

此外,復旦大學黃麗華教授在2017年10月召開的信息系統協會中國分會第七屆學術年會中指出,我們要從不同的角度看待大數據,從技術視角看,大數據具有體量大、多樣性、速度快和價值密度低的特徵;從思維視角看,大數據具有多維性、完備性和強相關性的特徵;從應用視角看,大數據具有決策有用性、功能多樣性、可重複採集性、應用協同性和安全危害性的特徵;從研究視角看,大數據具有多源多維、高顆粒度和動態實時的特徵。


日月恆升


你好,很高心回答你的問題!

下面是我的見解!

大數據的意義:

大數據是幫助企業利用海量數據資產實時、精確的洞察未知邏輯領域的動態變化,並快速重塑業務流程、組織和行業的新型數據管理技術構建顛覆性優勢:

①洞察未知:多樣化的數據使企業可以利用更為廣泛的數據以支撐企業更多維度的分析需求,而不再侷限於已知事實的分析,進而增加戰略洞察力;

②優化流程:動態的分析變化可以使企業實時監測分析業務流程的不足,進而不斷優化業務流程;

③實時響應:數據可實時訪問分析加速了企業獲取信息及分析的速度,進而使用戶更加靈敏的應對市場的變化。


大數據幾種較為常用的功能:

1.追蹤

互聯網和物聯網無時無刻不在記錄,大數據可以追蹤、追溯任何一個記錄,形成真實的歷史軌跡。追蹤是許多大數據應用的起點,包括消費者購買行為、購買偏好、支付手段、搜索和瀏覽歷史、位置信息等。

2.識別

在對各種因素全面追蹤的基礎上,通過定位、比對、篩選,可以實現精準識別,尤其是對語音、圖像、視頻進行識別,使可分析內容大大豐富,得到的結果更為精準。

3.畫像

通過對同一主體不同數據源的追蹤、識別、匹配,形成更立體的刻畫和更全面的認識。對消費者畫像,可以精準推送廣告和產品;對企業畫像,可以準確判斷其信用及面臨的風險。

4.提示

在歷史軌跡、識別和畫像基礎上,對未來趨勢及重複出現的可能性進行預測,當某些指標出現預期變化或超預期變化時給予提示、預警。以前也有基於統計的預測,大數據大大豐富了預測手段,對建立風險控制模型有深刻意義。

5.匹配在海量信息中精準追蹤和識別,利用相關性、接近性等進行篩選比對,更有效率地實現產品搭售和供需匹配。大數據匹配功能是互聯網約車、租房、金融等共享經濟新商業模式的基礎。

6.優化

按距離最短、成本最低等給定的原則,通過各種算法對路徑、資源等進行優化配置。對企業而言,提高服務水平、提升內部效率;對公共部門而言,節約公共資源、提升公共服務能力。


小玖說科技


大數據的幾層含義:

1、 指代巨大的數據集,是一種信息資產。

百科上解釋為:指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

可以簡單理解為:'大數據'是一個體量特別大,數據類別特別大的數據集,這樣的數據集無法用傳統數據庫工具對其內容進行抓取、管理和處理。

2、 指大數據技術體系,是一種新技術。

技術是大數據價值體現的手段和前進的基石。大數據有從採集、處理、存儲到形成結果的整個過程,每一個環節側重的技術會有不同。大數據技術簡單來說就是讓各種巨大的數據集產生各種“價值”的一種技術方法,比如經常說到的Hadoop體系、Spark生態、分佈式儲存、分佈式運算、實時計算等。

3、 指大數據的實踐和應用,實踐和應用是大數據的最終價值體現。

當前大數據技術體系已經趨於成熟,應用落地將是又一個重點被關注的層面,就像這次在疫情防控中大數據技術的應用一樣。

什麼是大數據?怎麼理解大數據?有哪些作用和應用場景?

https://www.toutiao.com/i6684835763634307587/


加米穀大數據


1、大數據的含義

大數據具有四大特點,即我們經常說的“4V”:Volume(大量);Velocity(高速);Variety(多樣);Value(低價值密度)。

Volume(大量) 截至目前,人類生產的所有印刷材料的數量是200PB。一些大企業的數據量已經接近EB量級。全球數據總量在今年有望達到50ZB。(1GB=1024MB 1TB=1024GB 1PB=1024TB 1EB=1024PB 1ZB=1024EB......)

Velocity(高速)這是大數據區於傳統數據挖掘的最顯著特徵。剛才說到全球數據總量在今年將達到50ZB,在如此海量的數據面前,如何快速、高效地處理這些數據,是一大挑戰,畢竟誰也不願意為了搜索一條信息等上一年。

Variety(多樣)在大數據領域,除了我們常見的文本、表格等結構化數據以外,還有大量的音頻、圖片、視頻等非結構化數據,這些多類型的數據對數據的處理能力也提出了更高的要求。

Value(低價值密度)價值密度的高低與數據總量的大小成反比。比如,在一天道路監控視頻中,我們只關心某個車牌在那幾秒鐘內的行駛軌跡。那麼如何快速地對有價值數據進行“篩選提純”也是一大挑戰。

2、大數據的作用

大數據對各行各業都能發揮巨大的作用,用於科學化決策,智能化決策,合理性決策等。

具體一點,例如:

氣象預報:預報總是不準的話,就失去預報的意義。

打擊犯罪:通過人臉識別、行動軌跡、DNA等手段可以快速定位犯罪分子。

工業製造:通過供求、市場等一系列的數據分析,可以提前指導生產,不至於產能過剩或者產能不足。

健康醫療:典型的例子,在美國,谷歌通過監測人們搜索的關鍵詞,比如:流感、發熱、胸悶、溫度計等。在某一地區的某一時間段內,有大量關於這些關鍵詞的搜索,那麼就存在一種潛在的關聯:這個地區很有可能存在對應的流感人群,儘早提醒相關部門發佈預警信息。

精準營銷:大數據能對客戶進行人物畫像,大家經常看今日頭條,你每次瀏覽的內容,花時間多的閱讀肯定是你感興趣的內容,那麼頭條會針對性的把你感興趣的內容或者廣告推送給你。

金融:可以加強風險控制,並迅速發現欺詐行為,提供更廣泛和更深入的數據分析和報告。 上面是舉了一些相關的例子,現實生活中還有很多。

未來,大數據技術將無處不在。


電子藝術之旅


大數據

互聯網行業發展迅速,傳統模式已經滿足不了大數據的增長。

1)存儲問題

數據庫存儲數據:沒有大數據之前,很多公司採用數據庫存儲數據,如mysql,postgres和oracle數據庫等等。比如今日頭條,每天要產生那麼多數據,使用傳統數據庫存儲技術肯定是不行的。自然地,就要用大數據存儲技術,大數據分佈式存儲就應運而生。
大數據存儲:可以作用在低成本的硬件上,服務器不需要很高的性能,並且會把數據存到磁盤上,並且可以備份。如果磁盤空間滿了,就增加磁盤,再存儲。比如,HIVE適合數據分析的數據庫,HBASE適合快速搜索的數據庫,當然它們都是存儲在HDFS上的。

2)分析數據問題

大數據分析:分佈式計算,實時處理技術。
磁盤計算:在計算過程中,多次落地磁盤。如離線計算,mapreduce。

內存計算:在內存中進行計算,類似實時處理技術。如 spark。

大數據的特點

1, 數據容量大(Volume)。從TB級別,躍升到PB級別。
2, 數據類型繁多(Variety)。相對於以往便於存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網絡日誌、音頻、視頻、圖片、地理位置信息等。
3, 商業價值高(Value)。客戶群體細分,提供定製化服務;發掘新的需求同時提高投資的回報率;降低服務成本。
4, 處理速度快(Velocity)。這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的“數字宇宙”的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。

喵感數據


大數據從概念角度去來講並無明確定義,通常從數據量,數據維度,數據更新速度和數據處理技術等維度來定義大數據。從某個維度(如數據量)來分析,大數據一直存在。隨著互聯網的興起,大數據才被重視並予以充分應用。

大數據的作用一直沒有被正確認知和理解,多數人提及大數據的價值多數會講畫像。相比較畫像,以大數據為基礎的算法服務,即人工智能服務更加重要。

我國人工智能領域發展迅速,但因數據多被壟斷在少數互聯網巨頭手中,這最終將影響產業整體價值。



TigerShangBJ


大數據的含義:

1、大數據是大量、高速、多變的信息,它需要新型的處理方式去促成更強的決策能力、洞察力與最佳化處理。大數據為企業獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。

2、藉助大數據及相關技術,我們可針對不同行為特徵的客戶進行針對性營銷,甚至能從“將一個產品推薦給一些合適的客戶”到“將一些合適的產品推薦給一個客戶”,得以更聚焦客戶,進行個性化精準營銷。

3、大數據時代下的精準營銷是指通過大數據獲取對象的喜好,行為偏好,對不同對象進行不同營銷。大數據精準營銷的核心可以概括為幾大關鍵詞:用戶、需求、識別、體驗。

主要由以下三點作用:

第一,對大數據的處理分析正成為新一代信息技術融合應用的結點。移動互聯網、物聯網、社交網絡、數字家庭、電子商務等是新一代信息技術的應用形態,這些應用不斷產生大數據。雲計算為這些海量、多樣化的大數據提供存儲和運算平臺。通過對不同來源數據的管理、處理、分析與優化,將結果反饋到上述應用中,將創造出巨大的經濟和社會價值。

第二,大數據是信息產業持續高速增長的新引擎。面向大數據市場的新技術、新產品、新服務、新業態會不斷湧現。在硬件與集成設備領域,大數據將對芯片、存儲產業產生重要影響,還將催生一體化數據存儲處理服務器、內存計算等市場。在軟件與服務領域,大數據將引發數據快速處理分析、數據挖掘技術和軟件產品的發展。

第三,大數據利用將成為提高核心競爭力的關鍵因素。各行各業的決策正在從“業務驅動” 轉變“數據驅動”。


分享到:


相關文章: