(2015-06-05)其實大數據就跟臍帶血一樣,聽起來潛力無窮,但是有沒有真正被廣泛應用,還是永遠你都只能聽過那些神奇的個案,但是到了自己要用的時候就跟屁一樣?

(Brain.com 2015-06-05)自從 IBM 為了要賣他們的伺服器,在 2010 年創造了「大數據 (Big Data) 」一名詞後,加上 Facebook 的竄起,一時間大家對於這個名詞趨之若鶩,不管怎樣的事情只要加上大數據好像就會變得超強的東西,於是什麼東西都要跟「大數據」混在一起,不過說混也太難聽,嚴格說起來現今大家談論的大數據包括:

1. 巨量且多樣性的數據即時收集
2. 產品或使用者行為預測
3. 商務決策的決策及驗證


一、巨量且多樣性的數據即時收集

有人常說:大數據才不是硬體工業,用硬體思維來做大數據是錯的,其實這句話嚴格來說是不對的。在 Big Data 的思維領域內,我們幾乎要收集的是用戶在溝通的介面上的所有操作行為,包含待會你要酸本篇,寫到一半想想算了,按下 backend 的鍵這些都是大數據可能會收集的目標。

但你真的知道存哪些數據才是對的嘛?不知道的情況下就全部先存起來再說吧(誤),這也是許多想做大數據的公司常遇到的問題(存臍帶血可以幹嘛?不知道,總有一天會用到),所以大數據第一個要解決的就是可以收集超多數據的硬體容量及能力,其後才是 Hadoop 或是其他可以處理 TB 、 PB 等級的技術發揮的地方,就像舒馬赫(軟體)再強,如果當年他不是在法拉利車隊而是在其他車隊,你覺得有可能會有同樣的成績嘛?

所以硬體的確還是大數據的硬實力,就算你軟體有在好的演算法,但還是需要強力的硬體支持,來幫我們算出真正的結果。

二、產品或使用者行為預測


前面要有夠強大的數據收集能力,都是為了要能夠準確的「預測」,大數據真正的精神並不是完全跟我們過去做數據化行銷一樣只是拿來驗證而已。

早期它可能叫做「統計學」,所以大家最喜歡的大數據分析就是「星座」,再加上一些些的心理學跟機率學。但是過去的統計學或是數據依歸的預測,它的依據母樹不夠大,可參考的變因不夠多,所以會有些許(?)的誤差。

這中間的差異就像是電視收視率調查的差異,就時代的收視率調查只是透過兩千個左右的機器在做統計分析,但是現在第四台業者可以直接透過機上盒使用者的資料來做收視率調查。但這也還不夠大,到了網路時代所有在網路上的影片觀賞行為都正在被收集,就像中國大多數人看「電視」其實都是透過網路來觀看的,所以更多的行為就能夠被收集。

而收集而來的「行為」透過許多模型公式的設計成為其中的變因,交集演算而成的結果,就是大數據應用的結果。包含一些猜你喜歡,或是推薦商品等,我們常聽到 Amazon 或是 淘寶 驚奇的準度案例,但是很少聽到台灣有相應的案例。

這就是因為要做好真正的「大數據」的前提是你收集的資料要夠多夠廣,變因設計的夠多模型才會越來越準,雖然人說「一樣米飼百樣人」但那是在「百」的等級,如果放到千萬人口、億級人口,可能都還是「一樣米飼百樣人」,也就是我的統計模型是要歸納出這一百樣人的輪廓是怎樣,大數據的應用也就能夠更精準的把「人」做歸類。

三、商務決策的決策及驗證

當一、二都做好了,其實最終還是得回歸人的判斷。大多數人對於數據分析其實都很沒有概念,看到表面上的結果 B 就以為理由 A 方向,但是實際上這個從 A -> B 的過程中,通常都還隱藏了關鍵變因 C 。

譬如說: ASAP 上有台塵蹣機銷售排行第一名,一看價格 1,480 元,很多人就會直覺得以為這是因為便宜所以才賣得好,所以我也去找差不多價格等級的貨來賣應該也會賣得好。結果一定不會是如此,這台塵蹣機賣的好的關鍵變因是因為我曾經寫了一篇開箱文,後續社群口碑擴散的效益,才造就這台機器賣的好。

但是在過去,關鍵變因 C 通常都藏在老先覺的頭腦及經驗裡,「得組王」他們在挑品的時候其實都有一套自己的邏輯及判斷方式,只是平常說不出來而已,這個就是我前面所說的模型公式及變因設計。當如果我們可以把這個挑品邏輯化做可被大數據歸納的公式,那就會變得就算不是老先覺也能做好挑品的工作。但是這時候誰來設計這個模型公式呢?

這就是「大數據人才」養成的目標及成功的方向了,「大數據人才」不僅是懂統計或是數據歸納,他同時必須要了解市場中的關鍵商務需求,最好還要加上一些心理學跟機率學的概念,也就是一個「通才」可能才有辦法做出符合市場需求的大數據模型。

這模型常人看不懂是正常的,畢竟光要把「得組王」的經驗模型化本來就是困難的事情,所以當初步的模型設計出來之後,就是要開始進行驗證及變因的調整,在經過越多的變因調整後,模型可能要打掉重來或是變得更好,但這都是大數據的一部分。而驗證的過程就比較接近一般比較常用的 Google Analytics 或是其他分析軟體,搭配上 KPI 的設計得出的結論。

所以其實大家在談的「大數據」定義真的是包羅萬象,其實我也就不再太想去糾正什麼,但你得知道的是你們在談論的是哪個等級的內容, ERP -> CRM -> Web Analytics -> Big data 這一路走來都可以說是 "Big data" 的集合。

所以在思考大數據的時候,車品覺前輩已經說過了,你還是得先想數據要怎麼「存」、怎麼「管」、知道怎麼「用」,才有後面「混、通、晒」,這才是真正在做大數據,成為一個大數據專業人才。

作者簡介:小黑,本名邱煜庭,不過還是希望大家稱呼他為小黑,臺灣網路行銷操作者,接觸網絡多年,曾任MIS、網站企劃、網路行銷企劃、行銷顧問。 專精於Google、Bing及百度白帽SEO,Inbound Marketing(集客式行銷)推廣者。 著有《 網路集客力 》一書(臺灣城邦集團PcUser出版),致力於集客式行銷及雙向O2O(Online to Offline, Offline to Online)的推廣。