大數(shù)據(jù)時(shí)代優(yōu)秀讀后感
大數(shù)據(jù)時(shí)代優(yōu)秀讀后感
《大數(shù)據(jù)時(shí)代》是一本值得大家閱讀的好書。讀完大數(shù)據(jù)時(shí)代這本書之后,我相信大家都會(huì)對(duì)這個(gè)時(shí)代有不同的看法。下文是《大數(shù)據(jù)時(shí)代》的讀后感,歡迎閱讀。
大數(shù)據(jù)時(shí)代讀后感篇一
信息時(shí)代的到來,我們感受到的是技術(shù)變化日新月異,隨之而來的是生活方式的轉(zhuǎn)變„„我們這樣評(píng)論著的信息時(shí)代已經(jīng)變?yōu)樵?jīng)。如今,大數(shù)據(jù)時(shí)代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時(shí)代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時(shí)代?大數(shù)據(jù)時(shí)代帶給了我們什么?
信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個(gè)高度概括抽象概念,是一個(gè)發(fā)展中的動(dòng)態(tài)范疇,是進(jìn)行互相交換的內(nèi)容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動(dòng)態(tài)、傳遞、共享、經(jīng)濟(jì)等特性卻是大家的共識(shí)。數(shù)據(jù):或稱資料,指描述事物的符號(hào)記錄,是可定義為意義的實(shí)體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀的事實(shí)描述,是構(gòu)成信息和知識(shí)的原始材料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)兩大類。數(shù)據(jù)指計(jì)算機(jī)加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號(hào)等。從定義看來,數(shù)據(jù)是原始的處女地,需要耕耘。信息則是已經(jīng)處理過的可以傳播的資訊。信息時(shí)代依賴于數(shù)據(jù)的爆發(fā),只是當(dāng)數(shù)據(jù)爆發(fā)到無法駕馭的狀態(tài),大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生。這是否是《大數(shù)據(jù)時(shí)代》一書所未曾闡述的背景材料?
在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對(duì),卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測(cè)未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測(cè)未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)。客戶數(shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長(zhǎng),海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營(yíng)管理能力„„可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時(shí)代讀后感篇二
讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想。”“隨著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會(huì)它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類”與“類”之間長(zhǎng)時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲小栴}不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會(huì)不會(huì)通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
大數(shù)據(jù)時(shí)代讀后感篇三
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響。
《大數(shù)據(jù)時(shí)代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過解釋在對(duì)未來進(jìn)行預(yù)測(cè),并對(duì)未來可能出現(xiàn)的問題提出自己看法與對(duì)策。
下面來重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時(shí)代》開篇就講了Google通過人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了20XX年美國(guó)的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)Google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著Google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時(shí)候,通過計(jì)算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計(jì)劃的失敗與Google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲(chǔ)存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無厘頭,但是大多數(shù)時(shí)候還是正確的,所以Google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無限的逼近事物的原貌。
之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。
無論如何,大數(shù)據(jù)時(shí)代將會(huì)到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀。因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實(shí)就是我們將會(huì)成為被預(yù)測(cè)被引誘的對(duì)象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個(gè)新的世界。
大數(shù)據(jù)時(shí)代讀后感篇四
如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認(rèn)真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時(shí)代》。維克托·邁爾——舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級(jí)企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國(guó)政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時(shí)代的預(yù)言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應(yīng)的理論功底,就能與之進(jìn)行一場(chǎng)思想上的對(duì)話。
一讀
舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分“大數(shù)據(jù)時(shí)代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀點(diǎn):一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù);二、更雜:不是精確性,而是混雜性;三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對(duì)于第一個(gè)觀點(diǎn),我不敢茍同。一方面是對(duì)全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對(duì)于簡(jiǎn)單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?我曾與香港城市大學(xué)的祝建華教授討論過。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個(gè)觀點(diǎn)中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對(duì)他第一個(gè)觀點(diǎn)很好的補(bǔ)充,這也是對(duì)精準(zhǔn)傳播和精準(zhǔn)營(yíng)銷的一種反思。“大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效。”更具有宏觀視野和東方哲學(xué)思維。對(duì)于舍恩伯格的第三個(gè)觀點(diǎn),我也不能完全贊同。“不是因果關(guān)系,而是相關(guān)關(guān)系。”不需要知道“為什么”,只需要知道“是什么”。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時(shí)代人們只關(guān)心因果關(guān)系,對(duì)相關(guān)關(guān)系認(rèn)識(shí)不足,大數(shù)據(jù)時(shí)代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語出驚人,對(duì)舊有觀念進(jìn)行徹底的否定。
世間萬物的復(fù)雜性多樣化并非非此即彼那么簡(jiǎn)單,舍恩伯格也是這種二元對(duì)立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關(guān)系,而是相關(guān)關(guān)系。”這一論斷時(shí),他在書中還說道:“在大多數(shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會(huì)繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’。”[i]由此可見,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。
大數(shù)據(jù)研究的一大驅(qū)動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時(shí)代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可“量化”,大數(shù)據(jù)的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價(jià)值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時(shí)仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個(gè)社會(huì)系統(tǒng)里,但他在第二部分大數(shù)據(jù)時(shí)代的管理變革中討論了這個(gè)問題。在風(fēng)險(xiǎn)社會(huì)中信息安全問題日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)成為一對(duì)矛盾。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語中所道:“大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來。”謝謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時(shí)代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
再讀
概念是研究的邏輯起點(diǎn),“大數(shù)據(jù)”到底是什么?在百度上搜索到的解釋是,“大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。”大數(shù)據(jù)的4V特點(diǎn):數(shù)量(Volume)、速度(Velocity)、品種(Variety)和真實(shí)性(Veracity)。但舍恩伯格認(rèn)為大數(shù)據(jù)并非一個(gè)確切的概念。他在書中的一段詮釋更具人文色彩和社會(huì)意義:“大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法。”[ii]其實(shí),概念的界定要看研究者從哪個(gè)角度來研究它而定。
科學(xué)家的治學(xué)態(tài)度是嚴(yán)謹(jǐn)?shù)?,而人文學(xué)家更具有想象力。一些對(duì)大數(shù)據(jù)不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認(rèn)為大數(shù)據(jù)的核心是預(yù)測(cè)。“大數(shù)據(jù)不是要教機(jī)器像人一樣思考。相反,把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)期事情發(fā)生的可能性。”[iii]舍恩伯格甚至不回避大數(shù)據(jù)所產(chǎn)生的負(fù)面影響,他在第七章里談到讓數(shù)據(jù)主宰一切的隱憂。我覺得這是實(shí)事求是的科學(xué)態(tài)度。在量子力學(xué)里有一個(gè)測(cè)不準(zhǔn)原理:一個(gè)微觀粒子的某些物理量(如位置和動(dòng)量,或方位角與動(dòng)量矩,還有時(shí)間和能量等),不可能同時(shí)具有確定的數(shù)值,其中一個(gè)量越確定,另一個(gè)量的不確定程度就越大。它是解釋微觀世界的物理現(xiàn)象,信息社會(huì)中的大數(shù)據(jù)會(huì)不會(huì)也有類似情況呢?如果我們?cè)侔褎P文·凱利的《失控》對(duì)比來讀的話就更有意思了,這樣我們對(duì)整個(gè)物質(zhì)世界及至人類社會(huì)就有了更全面更深刻的洞察,從物理王國(guó)到生物世界,再到信息社會(huì)。從公共衛(wèi)生到商業(yè)應(yīng)用,從個(gè)人隱私到政府管理,大數(shù)據(jù)無處不在。與此同時(shí),從哪個(gè)角度探討用什么方法研究,舍恩伯格都不會(huì)忘記大數(shù)據(jù)服務(wù)人類造福人類的終極目的和價(jià)值所在。“大數(shù)據(jù)并不是一個(gè)充斥著運(yùn)算法則和機(jī)器的冰冷世界,其中仍需要人類扮演重要角色。人類獨(dú)有的弱點(diǎn)、錯(cuò)覺、錯(cuò)誤都是十分必要的,因?yàn)檫@些特性的另一頭牽著的是人類的創(chuàng)造力、直覺和天賦。偶爾也會(huì)帶來屈辱或固執(zhí)的同樣混亂的大腦運(yùn)作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應(yīng)該樂于接受類似的不準(zhǔn)確,因?yàn)椴粶?zhǔn)確正是我們之所以為人的特征之一。”[iv]用中國(guó)話來說就是“人無完人”,人類在收獲大數(shù)據(jù)帶來的紅利的同時(shí)也要承受它帶來的危害。這不是對(duì)立統(tǒng)一的辯證唯物主義?我把它看作帶著歐洲批判學(xué)派色彩的科學(xué)發(fā)展觀。
問題是研究的價(jià)值基點(diǎn),“大數(shù)據(jù)”不是舍恩伯格研究的問題,而是研究對(duì)象,他研究的是數(shù)據(jù)處理和信息管理問題,同時(shí)也討論信息安全和網(wǎng)絡(luò)倫理問題,還引發(fā)哲學(xué)上的思考,哲學(xué)史上爭(zhēng)論不休的世界可知論和不可知論轉(zhuǎn)變?yōu)閷?shí)證科學(xué)中的具體問題??芍允墙^對(duì)的,不可知性是相對(duì)的。“大數(shù)據(jù)”之所以為大是因它引發(fā)人類生活、工作和思維的大變革,從這個(gè)意義上來看,《大數(shù)據(jù)時(shí)代》的意義不僅在于它討論了若干重大問題,而且對(duì)研究者開出了一個(gè)問題清單,從而引發(fā)更多人來探討這些有趣的問題。
《大數(shù)據(jù)時(shí)代》實(shí)際上主要是一本討論數(shù)據(jù)挖掘的書,數(shù)據(jù)挖掘與數(shù)據(jù)分析是不同的概念,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性的信息的過程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。而數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對(duì)象的內(nèi)在規(guī)律。數(shù)據(jù)挖掘主要運(yùn)用計(jì)算機(jī)來進(jìn)行處理,而數(shù)據(jù)分析既要用計(jì)算機(jī)也要人工分析,是計(jì)算機(jī)科學(xué)與人文價(jià)值判斷的統(tǒng)一結(jié)合。換言之,《大數(shù)據(jù)時(shí)代》并不是一本討論大數(shù)據(jù)所有問題的書。
《大數(shù)據(jù)時(shí)代》也是一本討論互聯(lián)網(wǎng)發(fā)展的書,從數(shù)字化到數(shù)據(jù)化,同時(shí)有濃厚的未來學(xué)色彩。當(dāng)文字變成數(shù)據(jù),我們進(jìn)入了互聯(lián)網(wǎng);當(dāng)方位變成數(shù)據(jù),我們進(jìn)入了物聯(lián)網(wǎng);當(dāng)溝通變成數(shù)據(jù),我們進(jìn)入了下一代互聯(lián)網(wǎng)。一切可量化,萬物皆數(shù)據(jù),正是當(dāng)今互聯(lián)網(wǎng)世界的真實(shí)寫照。面對(duì)于這樣的世界及世界的未來,在《大數(shù)據(jù)時(shí)代》出現(xiàn)最多的詞是“思維”和“方法”,因此也可以把這本書視為思維科學(xué)應(yīng)用研究的書。
此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
三讀
今年國(guó)慶節(jié)前一天,中共中央政治局們來到中關(guān)村搞集體學(xué)習(xí),調(diào)研、講解、討論創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略。包括、在內(nèi)的七位全部出動(dòng)來到中關(guān)村,這是歷史上沒有過的,百度、聯(lián)想和小米的負(fù)責(zé)人,有了一次直面最高層匯報(bào)工作的機(jī)會(huì)。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業(yè)務(wù)發(fā)展得如何好,而是講起了大數(shù)據(jù)。在講解中,李彥宏認(rèn)為大數(shù)據(jù)有兩個(gè)重要價(jià)值,一是促進(jìn)信息消費(fèi),加快經(jīng)濟(jì)轉(zhuǎn)型升級(jí);二是關(guān)注社會(huì)民生,帶動(dòng)社會(huì)管理創(chuàng)新。這些價(jià)值也是目前黨和國(guó)家領(lǐng)導(dǎo)人最為重視的,可見《大數(shù)據(jù)時(shí)代》既有理論價(jià)值也有現(xiàn)實(shí)意義。
當(dāng)今大數(shù)據(jù)正在影響著新聞傳媒業(yè),大數(shù)據(jù)新聞、大數(shù)據(jù)營(yíng)銷、輿情分析、受眾(用戶)研究……數(shù)據(jù)分析師變身新聞編輯,大數(shù)據(jù)正改變新聞生產(chǎn)流程、大數(shù)據(jù)在創(chuàng)造傳媒新業(yè)態(tài)。“不妨想象一下,隨著數(shù)據(jù)的進(jìn)一步增加,坐擁用戶資源的新媒體們完全有能力通過數(shù)據(jù)挖掘,分析用戶癖好,向電視臺(tái)定制一部電視劇甚至向好萊塢定制一部電影。到那個(gè)時(shí)候,電視臺(tái)一如那些家電廠商們,曾經(jīng)產(chǎn)業(yè)鏈的上游‘王者’,將徹底成為一個(gè)產(chǎn)業(yè)鏈最低端的內(nèi)容代工廠。”[v]然而,情形也遠(yuǎn)沒有人們想象的那么樂觀,李彥宏指出目前多數(shù)所謂的大數(shù)據(jù)公司其實(shí)還是空殼子,因?yàn)閿?shù)據(jù)還沒有完全開放。他認(rèn)為必須在政府層面上推動(dòng)才能真正實(shí)現(xiàn)大數(shù)據(jù)的開發(fā)與利用。我在討論大數(shù)據(jù)時(shí)代的輿情監(jiān)測(cè)與預(yù)警時(shí)說道:“經(jīng)典自由主義傳播學(xué)說對(duì)媒體的定位:秉持公正、客觀立場(chǎng)的媒體被稱為代表公眾監(jiān)督政府行為的‘看門狗’。其實(shí),媒體既是公眾利益也是國(guó)家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統(tǒng)媒體信息反饋渠道單一,視野、人力十分有限。而開放互動(dòng)的新媒體平臺(tái)卻大有可為。作為公共信息發(fā)布平臺(tái)的微博可以成為政府及時(shí)了解社情民意,從而選擇正確治理路徑的‘導(dǎo)盲犬’。”[vi]遺憾的是目前我國(guó)的數(shù)據(jù)平臺(tái)還沒有完全開放,真正的大數(shù)據(jù)時(shí)代還沒有到來。
與國(guó)內(nèi)不少教科書寫法的專著相比,國(guó)外的書寫得更有趣,尤其是大學(xué)者寫的,不僅視野開闊,而且能夠深入淺出。《大數(shù)據(jù)時(shí)代》不到22萬字,卻有上百個(gè)學(xué)術(shù)和商業(yè)的實(shí)例,豐富翔實(shí)的例子讓讀者感到通俗易懂,深?yuàn)W的理論看起來也不費(fèi)勁。這恐怕與舍恩伯格既是學(xué)者也是專家,既有理論又有實(shí)踐有關(guān)。反觀我們些學(xué)者故弄玄虛而示高明,實(shí)際上是把讀者拒之門外。我覺得優(yōu)秀的科學(xué)家也應(yīng)該是一個(gè)科普作家,優(yōu)秀的學(xué)者也應(yīng)該是一個(gè)不錯(cuò)的傳播者。當(dāng)然國(guó)外學(xué)術(shù)著作也有一個(gè)翻譯問題,這本書譯得還不錯(cuò)。此外,《大數(shù)據(jù)時(shí)代》還附有不少IT界名流的推薦意見,雖是出版商的發(fā)行所為,對(duì)解讀此書也不無益處。
除了《大數(shù)據(jù)時(shí)代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數(shù)據(jù)不能只讀一本書,該書譯者周濤教授還推薦了三部國(guó)內(nèi)出版的大數(shù)據(jù)方面的專著:《證析》、《大數(shù)據(jù)》、《個(gè)性化:商業(yè)的未來》。相比《大數(shù)據(jù)時(shí)代》的宏大視野,這些書就大數(shù)據(jù)某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國(guó)工程院李國(guó)杰院士和中科院計(jì)算所副總工程學(xué)旗合寫的文章《大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考》。
雖說開卷有益,但是由于每個(gè)人的時(shí)間精力有限,對(duì)于一個(gè)研究者來說,不讀什么書甚至比讀什么書更重要。我認(rèn)為書有三種:有用的書,主要是應(yīng)用類的專業(yè)書;無用的書,主要是形而上的思想類;無字的書,人間百態(tài),社會(huì)現(xiàn)實(shí)。可偏重但不應(yīng)偏廢。對(duì)于學(xué)生來講這三類“書”都該讀一些,對(duì)于研究者則要讀哪些解決關(guān)鍵問題的書,《大數(shù)據(jù)時(shí)代》就是這樣一部書。當(dāng)然,并非第一個(gè)讀者都是研究大數(shù)據(jù)的,但進(jìn)入大數(shù)據(jù)時(shí)代,還有什么東西與數(shù)據(jù)完全沒有關(guān)系呢?麥肯錫全球研究機(jī)構(gòu)認(rèn)為,未來十年里有12項(xiàng)對(duì)經(jīng)濟(jì)發(fā)展產(chǎn)生重大影響的技術(shù),其中包括三項(xiàng)新媒體技術(shù):移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算。這三項(xiàng)新媒體技術(shù)都與大數(shù)據(jù)密切相關(guān),而這些新媒體新技術(shù)的發(fā)展都影響著當(dāng)今的新聞傳播業(yè)。閱讀此書至少給我們研究新聞傳播學(xué)帶來一些啟迪。我覺得一本書的價(jià)值不在于讓你頂禮膜拜,而是引發(fā)廣泛而深入的討論。
“凡是過去,皆為序曲。”讀完此書,我們對(duì)大數(shù)據(jù)的認(rèn)識(shí)才剛剛開始。
猜你感興趣:
1.大數(shù)據(jù)時(shí)代體會(huì)文章
2.大數(shù)據(jù)時(shí)代讀書心得體會(huì)
3.讀大數(shù)據(jù)時(shí)代心得體會(huì)