02.25 大數據是不是科學,為什麼?


大數據當然不是科學,大數據只是一個量詞,其數據本身,只是存在於自然界的一切物質在不同維度上的一個點的反映,通過對不同維度上點(數據)的積累,運用不同的科學方法,進行分析論證預測及關聯性應用。


大風裡的風


先說觀點,大數據是科學。

這個問題其實挺難回答,因為涉及到兩個比較難於理解的概念:“大數據”和“科學”。

科學是正確反映世界本質與規律的理論,不可證偽。

大數據理論被數據科學家維克托·邁爾-舍恩伯格2008年在《大數據時代》中提出。

大數據指是指無法用常規工具進行處理、需對所有數據進行分析處理的數據學科。

如果要系統的認知大數據,就必須從三個層面來著手來分析他,具體的大家可以找相關的書籍來看:

一、大數據理論

1、大數據特徵:具有5V特點Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。

2、價值探討

3、現在和未來

4、大數據隱私

二、大數據技術

1、雲計算

2、分佈式處理平臺(Hadoop)

3、存儲技術

4、感知技術

三、實踐

1、互聯網的大數據

2、政府的大數據

3、企業的大數據

4、個人的大數據

大數據的核心就是預測。大數據將為人類的生活創造前所未有的可量化的維度。大數據已經成為了新發明和新服務的源泉,而更多的改變正蓄勢待發。


打工男


大數據是不是科學,為什麼?

回答這個問題前,我們先來看一下什麼是大數據?

大數據(big data),IT行業術語,是指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中,大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。

再來看一下,什麼是科學,科學的定義是什麼?

科學 指正確反映世界本質與規律的理論,包括正確的概念、命題、原理與理論體系;其對象是客觀本質與客觀規律,內容是科學本質與科學規律,形式是語言,包括自然語言與數學等人工語言。科學和科學理論是同義語。真正的科學或科學理論不可證偽。根據科學反映對象的領域,科學目前分為自然科學、社會科學、思維科學、橫斷科學、縱深科學、哲學六個大類。

看了以上什麼是科學和什麼是大數據後,不難得出,大數據是科學的結論。為什麼呢?

一·大數據是一個正確的概念;

二·大數據是正確反映世界本質與規律的理論。

以上兩條在對科學的定義裡面都包括了,所以說大數據是科學。


電腦參謀


大數據本身既不是科學,也不是技術,我個人認為,它反映的是網絡時代的一種客觀存在,各行各業的大數據,規模從TB到PB到EB到ZB,都是以三個數量級的階梯迅速增長,是用傳統工具難以認知的,具有更大挑戰的數據。

大數據來源於人類的測量、記錄和分析世界的渴望和無盡的追求。隨著信息技術,尤其是傳感器、通信、計算機和互聯網技術的迅猛發展和廣泛應用,人類獲取數據的手段越來越多,速度大大加快、成本急劇降低,層次和尺度更為精細,揭示自然現象和社會現象更加深刻,人聯網和物聯網又使得人人物物都成為數據源,這樣一來,大數據成為網絡時代人類社會的重要資產。

數據量巨大,價值密度低,實時在線,多源異構,怎麼辦?舉個例子吧!聚類,物以類聚,人以群分,這是人類幾千年來認識世界和社會的基本能力,是從大數據中發現價值必須面對的一個普遍性、基礎性問題,是認知科學作為學科的學科,要解決的首要問題。無論是政治、經濟、文學、歷史、社會、文化、還是數理、化工、醫農、交通、地理、各行各業的大數據或宏觀或微觀的任何價值發現。


雲和數據



2016年2月,教育部公佈新增“數據科學與大數據技術”專業,北京大學、對外經濟貿易大學、中南大學成為首批獲批高校。次年,又有32所高校獲批。此次248所高校獲批“數據科學與大數據技術”專業,幾乎是前兩次獲批高校的8倍。


“沒有什麼行業是沒有數據的”


“我認為沒有什麼行業是沒有數據的。”清華-伯克利深圳學院數據科學與信息技術專業一年級碩士生王宇傑說。


他在去年9月從一名工科本科生跨學科進入了大數據專業。


大數據專業正成為時下火熱的高校新增專業。在4月28日舉行的教育部新聞發佈會上,教育部高等教育司副司長範海林介紹,2017年全國高校備案專業中,新增數據科學與大數據技術專業點250個,同比增加了近7倍。從中國人民大學、北京師範大學、廈門大學等知名大學,到一些地方院校均投入了這股熱潮。



王宇傑大二時在一次展會上不經意接觸到了一款大數據可視化軟件Tableau,由此對大數據產生了濃厚的興趣。通過Tableau,王宇傑感受到,數據分析這個行業的潛力無可限量。隨著移動互聯網大數據時代的到來,數據量正在不斷增長。未來,更多人將學會分析數據,並將數據的洞察運用到工作和生活中的方方面面。數據分析會從小眾走向主流,人人都可以成為數據分析師。接下來的大學時間裡,他參加了一些數據科學家訓練營,和一些商業機構組織的訓練營,還在慕課網站上自修了國外大學的大數據課程。


他在2016年的Tableau可視化分析爭霸賽北京賽區比賽中拿到了第一名。Tableau可視化分析爭霸賽是全球可視化數據分析人士的年度饕餮盛宴,每年都會成千上萬數據狂人參加這一比拼。這其中,既有來自各行各業的數據分析專家,也有像王宇傑這樣的數據愛好者,而王宇傑是獲獎選手中唯一一名大學生。通過這些活動,王宇傑結識了這個一不斷壯大的數據分析社區,也讓他對這個行業更加充滿熱情。



大四時,王宇傑得到了保研的機會,“國內開設大數據方向研究生專業的大學並不多,主要有清華大學、北京大學、復旦大學、北京航空航天大學等,這是當時比較知名的幾個高校。”王宇傑說。


王宇傑得到了北大和清華的offer,權衡之後,他選擇了清華-伯克利深圳學院,這是清華和伯克利合辦的碩士研究生項目,不僅可以在清華拿到數據科學學位,還有機會到美國加州大學伯克利分校去進行為期9個月的學習,同時拿到相關學位。


“我是清華-伯克利深圳學院招收的第二屆碩士生,也就是說,大數據專業其實是一個非常嶄新的學科,在我申請的那一年,相對來說,大家對這個概念還不是特別瞭解,當然已經有一定數量的申請者,遠超我們實際錄取的人數,但並不是那麼的火爆。”王宇傑說。



“到了我下面那屆,就是招收第三屆碩士生的時候,競爭就變得異常激烈,在短短一年時間裡,這個專業成為了大家認可的非常有潛力的專業,大批的工程本科生,或者是數學、經濟方面的學生開始申請我們這個方向,因此錄取率直線下降。個人感覺在近幾年內,競爭會變得越來越激烈。”他說。


清華-伯克利深圳學院的數據科學與信息技術研究中心設有6個實驗室,分別為傳感器與微系統實驗室、納米器件實驗室、物聯網與社會物理信息系統實驗室、未來互聯網研究實驗室、大數據實驗室、智能成像實驗室。


“我想一般人會認為我們專業課的名稱會比較高大上,像大數據分析、大數據基礎等,的確會有這些,但從本質上來說,我認為我們學的課程跟數學、工程學這些基礎學科沒有太大區別,當然加入了一些新興科技的課程,比如現在很火的深度學習、人工智能。”他告訴記者。



王宇傑進入了智能成像實驗室,學習和科研課題是關於計算機視覺。“用一句話來概括,我們要做的是賦予計算機人的視覺能力。怎麼理解呢?以後是一個有大量機器人存在的世界,而機器人要跟人類進行交互,做一些基本的工作,必須要有視覺能力,看得懂周圍的環境,所以我們做的事情就是通過技術的方法讓計算機擁有人的這種視覺能力。”他說。


熱門專業:數據科學與大數據技術


3月21日,教育部公佈了2017年度普通高等學校本科專業備案和審批結果。


在新增備案本科專業中,“數據科學與大數據技術”最為熱門。根據統計,共有250所高校新增“數據科學與大數據技術”專業,其中包括中國人民大學、北京師範大學、廈門大學等19所教育部直屬高校。河南省21所高校新增該專業,為最多的省份。河北、山東、安徽、廣東、江蘇等省也有較多高校成功獲批。



2016年2月,教育部公佈新增“數據科學與大數據技術”專業,北京大學、對外經濟貿易大學、中南大學成為首批獲批高校。次年,又有32所高校獲批。此次248所高校獲批“數據科學與大數據技術”專業,幾乎是前兩次獲批高校的8倍。


該專業備受高校青睞與國家大力支持大數據產業發展及該產業人才奇缺相關。


國務院2015年8月曾印發《關於印發促進大數據發展行動綱要的通知》,明確鼓勵高校設立數據科學和數據工程相關專業,重點培養專業化數據工程師等大數據專業人才。

根據教育部上述2017年度高校本科專業備案和審批結果,此次共有60所高校獲批“機器人工程”專業。


“機器人工程”專業大熱的背後,是人工智能行業的持續發展。



3月6日,南京大學官網正式發佈新聞,經研究決定,南京大學正式成立人工智能學院。今年政府工作報告中四次提及“智能”,並特別指出要“加強新一代人工智能研發應用”、“發展智能產業”。


值得注意的是,從清華大學到地方高校,大數據專業成為普遍的時尚。“清華或者其他一般院校,在這個領域裡對科研的貢獻會有差異,但事實上,在如今的大環境之下,大家都想跟上時代潮流,所以我認為無論處於怎樣的研究水平,敢於去跟上這個時代,就是挺好的一件事情。”王宇傑說。


“大數據是一個概念,它包含的範圍非常廣,不同的專業方向,對外顯示的名稱可能都是大數據分析、大數據工程與技術,但是整個產業其實非常龐大,從前到後擁有一個很大的產業鏈。”他說。



“我認為數據分析師這個稱謂已經太過寬泛了,我覺得這個行業需要細分,未來會有專門做算法的工程師,專門做硬件實現的工程師,以及專門做理論推導的科研人員等。”他說。


搜課


大數據不僅是一種科學,更是一種對企業成長,行業發展有推動作用的核心技術,一個行業的發展數據,一個人群的消費數據,一個社區業主數據,一個學校的家長數據,學生數據,師資數據,都可以成為一個大數據機構的核心基礎,以數據為核心,以用戶為核心,驗算出不同的服務體系,應用體系,行動方案,個性化方案,也將成為私域流量的核心應用。

總之大數據應用的掌握會讓某個領域的發展變得得心應手,遊刃有餘,再加上互聯網科技的運用,會成為一種核心競爭力的重要武器





零售新變革


大數據是科學,科學源自於生活。

所以說你在問這個問題的時候你其實想的是大數據是不是迷信?!

用我這個行外人的觀點來講,“大數據”這個詞語就跟它書面上的意思一模一樣。

大+數據=大數據。

一、“大”就不用解釋了。宏觀、多、只是一個量比詞。

二、“數據”是什麼呢?是各種觀念、觀點、習慣這些的一個數據化的體現。就比如說你身邊使用安卓手機多還是蘋果手機多。按照10個人算有6個人使用安卓,4個人使用蘋果。 裡面的數字就是數據的體現。只不過在科學裡面的數據更加深奧,我們無法解讀罷了。

那個這兩個詞語結合起來就是“大數據”。

所以說大數據其實就是在我們現有階段將多種數據進行分析驗算,得出結論的一個科學。

最後說一句,其實大數據很早就有,就是我們的圖書館。


Mr愛答不理君


談到大數據,讓我想起了華為任總有一段採訪。提到大數據其實本質上是統計學,而國內在統計學及學科發展上面已經嚴重滯後,所以敦促加強各個基礎科學的投入,進而再談到了要用最優秀的人去教育出更優秀的人。

只不過大數據在這裡只是變成了一種簡稱,當然大數據首先得數據量大,其次通過足夠大量的數據,分析,歸納,總結出數據後面呈現出背後的規律,其本身並沒有臆測。

所以我認為大數據是科學



劉晶Larry


大數據算不算科學,我覺得必須算。科學是指人類探索研究感悟宇宙萬物變化規律的知識體系的總稱。 科學是一個建立在可檢驗的解釋和對客觀事物的形式、組織等進行預測的有序的知識的系統。

而大數據恰恰就是根據以往的海量數據,分析研究感悟世界萬物變化的規律,從而分析人或事物的發展規律,並且作出預測。

如天氣預報,也是需要綜合以往的天氣情況,找出規律,分析往後幾天的天氣變化趨勢。

科學不僅僅指發明創造,只要是能分析世界萬物發展規律的方法,併為全人類所用,都可以叫科學。

個人觀點,覺得正確請點大拇指


呂畢華


不是科學是統計學它用處是約束個體,在這種環境下人的自由性就大打折扣,帶來的是個體創新能力的下降,科學發現從何談起!


分享到:


相關文章: