大數據能夠改變什么
大數據(big data,mega data),或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。一起來看看大數據能夠改變什么吧!
1、大數據時代來了
隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯網應用更加豐富。更多的傳感設備、移動終端接入到網絡,由此產生的數據及增長速度將比歷史上的任何時期都要多,都要快。未來的十年將是一個“大數據”引領的智慧科技的時代。
時過年中,方凡對“幸福的煩惱”體會逾深。他是北京水晶石數字科技有限公司的CIO,重要的職責就是為這個龐大的“視覺展示制造器”提供源源不斷的計算支持。公司自2008年北京奧運會一舉成名后,包括上海世博會、深圳大運會和倫敦奧運會在內的大型訂單相繼而至,“生意最近好的不得了”,他也成為了公司最忙碌的人之一。
此時的水晶石正站在一個臨界點上,營業額將由8億元繼續攀升,員工近3300人,經常要承接其他公司所無法拿下的大型訂單。同時,一些新的業務模式也正被創造出來。比如,水晶石為萬科、SOHO中國等房地產企業打造在線房產服務,顧客在網上瀏覽時,可以從各個角度考察房源,甚至可以自己動手進行DIY模擬裝修。
在方凡看來,水晶石能夠成為行業翹楚,多年來在大數據上積累的雄厚實力十分關鍵。視覺展示行業極度依賴數據,水晶石每年的數據量都要增長上百個PB,背后需要龐大的計算、存儲和網絡能力的支撐。簡單一點來說,渲染一個大型的高清圖像,別人需要100個小時,水晶石卻可以調動3倍以上的計算資源和人員儲備,在10個小時內完成。
“大數據融入企業越深,就越考驗企業的投資和儲備能力,企業的級別將立判高下。”方凡甚至表示,視覺展示行業已經進入一個為大數據不斷燒錢的階段。
麥肯錫全球研究院對這樣的趨勢做了專門研究,其發布的《大數據:創新、競爭和生產率提高的前沿領域》報告稱,大數據將大幅提升傳統行業的運營效率,并催生更多的新型業務應用和商業模式,而有效投資和利用大數據,已經成為了行業領軍者的制勝法寶。
2、企業與大數據結緣
多年來,有關海量數據的討論已讓人審美疲勞,現在又提出大數據,究竟有何不同?是否有炒作的嫌疑?一個有趣的現象是,包括IBM、HP、Oracle、SAP等跨國IT巨頭,咨詢公司以及歐美企業對大數據的討論趨于熱烈,剔除其中的炒作成分,不乏有價值的技術解決方案和最佳實踐,而多位國內CIO坦稱也正在關注大數據。
有不少人正在嘗試勾勒大數據的面貌,讓其由模糊走向清晰。IDC全球存儲及大數據研究項目副總裁一直在研究大數據,簡單一點說,大數據不僅僅是海量數據,它更為復雜,更追求數據處理的速度,企業也更注重挖掘其中的價值。
華爾街老兵,投資公司創始人羅杰?依倫伯格最近也撰文暢談所看到的大數據投資前景:“我們還處在這場由數據驅動的革命的初始階段。現今,這些機遇已讓人興奮不已,未來,這些機遇所能帶來的變革必將超乎我的想象。”
這些判斷似乎都能自圓其說,但對于講求實際效益的商業世界而言,大數據究竟能帶來多大的改變?
作為中信銀行信用卡中心數據倉庫室項目總監,顧小波明顯感覺到新的挑戰正在來臨。隨著中信銀行信用卡用戶突破1100萬,需要挖掘的數據量正在膨脹,傳統利用SPSS統計分析軟件建模的方式已經有些力不從心,而如果采用抽樣統計分析的方式,有些新的用戶行為特征或業務趨勢就會被忽略。
更重要的是,隨著銀行信用卡競爭已經從初期“跑馬圈地”進入精細化耕作的新階段,用戶使用行為的數據量增長已經快過新增用戶的增速,原先寬松和粗獷的大筆投資已不可能,銀行需要將更多的精力放在維護客戶和挖掘客戶價值上面,以獲得更多的收益。
多年前,中信銀行率先將信用卡用戶分析數據應用于電話銷售業務中,坐席人員不再是大海撈針式的忙碌,中信銀行的電話保險業務購買率一年內就實現了30%的增長。現在,顧小波正推動信用卡數據倉庫部門與更多的業務部門進行對接。
比如,現在中信銀行的用戶只需刷卡三筆,立刻就能享受到9元購買電影票的優惠。在以前,中信銀行的核心業務系統在處理完當天的交易信息后,再過幾天,才能被識別出滿足促銷條件的用戶。
同時,顧小波還在對中信信用卡網站的用戶使用行為進行分析,這些非結構化數據以前是被忽略的,現在中信已可以及時了解用戶在哪一步放棄了哪項業務,從而改正網站業務設計中的不足。
中信銀行信用卡部門在大數據中面臨的挑戰與機遇,幾乎大部分的企業都會遇到,這也是大數據與以往所提的數據挖掘與商業智能的不同之處:一是數據量快速攀升,傳統的數據挖掘工具已經無法應對全量分析的需求;二是對于數據處理速度的要求越來越高,更快的速度意味著更好的用戶體驗和更迅即的商業決策;三是非結構化數據的挑戰日增,有效的收集和處理將帶來更多的業務價值。
在支付寶,大數據正影響著公司從上到下的決策和業務運作。目前,通過利用“PC服務器集群+開源軟件”、采用數據庫軟件等手段,支付寶每天可以對僅300億條用戶交易數據進行查詢,結果可以在20毫秒內返回。
這帶來了兩大好處:一是可以有效控制風險,一旦用戶在超乎常規的地點登陸,或者進行超過2000元以上的大額轉賬,支付寶會根據對用戶使用行為的歷史分析,進行主動的風險攔截;二是可以進行實時的營銷業務推送,比如用戶一旦購買了珠寶等高價商品,支付寶會立刻向其推送一個消費紅包,馬上就可以進行二次消費,以增強用戶粘性。
蔣杰認為,做到這一切的秘訣在于支付寶正實現online與offline數據挖掘的融合,這使得商業智能已不僅僅是針對歷史數據的分析和報表呈現,而是可以做一些針對大數據的實時處理結果,實現對業務應用的可伸縮性調整。例如,廣告營銷業務部門可以通過利用支付寶數據庫的分析數據,監控營銷活動的效果,一旦不為用戶接受,就立刻做出調整,而網站UI設計師也可以從用戶訪問軌跡中,探尋到導致用戶放棄購買行為的設計缺陷,從而進行設計優化。
“支付寶已經成為數據化運營的公司,從CEO到業務人員以及數據挖掘分析師,都有利用數據挖掘的場所,可以說是全員數據化,大數據已經成為支付寶最大的財富。”目前,支付寶的用戶已超6億,預計今年年底數據量會增至1.8PB,蔣杰總結出一個定律:支付寶的交易量每年會翻倍,而數據量增長則會增長四倍左右。對于支付寶而言,這將是企業數據化生存的重要機遇。
某種程度上說,大數據也強調商業智能的重要性,但它呈現出來的新特性,正試圖超越商業智能的范疇,從而開辟企業進行商業優化的新疆界。
3、大數據引領行業變革
去年10月,北京海淀區稻香湖金融服務區的200畝地被“圈走”,這里將籌建證券行業的行業數據中心,屆時,各大券商將把自家數據共享至此,一方面省去了自建災備中心的投入,另一方面這個數據中心將為整個行業提供全新的增值服務。
民族證券總工程師馬光悌參與了該項目的認證和籌劃,并將其視為“影響整個行業的大事件”。在他看來,行業數據中心是證券行業應對大數據的有益嘗試,憑借其計算能力,證券公司可以對當天的交易數據進行更為迅速的分析,響應速度將獲得提升。同時,共享的行業數據可以使得券商拿到更為全面和準確的行業分析結果,這是券商自建數據中心所不能獲得的增值服務。
在不久的將來,大數據或許能呈現出改變整個行業的力量。
國家電網公司去年建成了電力云仿真實驗室,其中一個重要課題就是如何解決海量數據存儲與運算的難題。國網信通公司云計算與信息資源中心主任吳凱峰表示,大數據是國網實現智能電網必須要面臨的挑戰,一方面,國網在輸電線路上布設了大量的監控點,每秒都要傳回海量數據,同時,智能電表實現規模推廣后,電網公司需要縮短用電數據的收集時間,數據量也將激增。
“這就出現一個難題,就是如何在下一個數據采集高峰期來臨之前,將上一次采樣結果計算出來。而準確分析用戶的用電行為,將為制定階梯電價,以及達到輸電與用電的平衡,提供重要的決策支持。”吳凱峰稱,相關解決方案還在測試當中,但有效應對大數據的挑戰,將是實現電網互動的關鍵之一。
不過,國網公司的智能互動嘗試并不僅限在電力行業,它正試圖推動相關行業的產業變革。在國網對于未來智能電網的藍圖中,已經將版圖擴張至電動汽車與充電設施、家庭新能源利用、智能家居和電力光線到戶等領域。
為此,國網今年將大力建設67座智能變電站,推廣應用5000萬具智能電表,并新建173座充換電站和9211個充電樁,完成25個智能小區/樓宇建設。
據業內人士分析,智能電網相關產業要從試點走向快速發展,它們與電網公司的智能對接將是關鍵,需要實現無縫和實時的數據傳輸,而這無疑將考驗著國網應對大數據的能力。
而在麥肯錫的報告中,仔細分析了美國醫療行業、歐洲政府公共服務、美國零售業、全球制造業以及個人位置信息行業——它們在2010年占據了全球GDP約40%的份額,據稱,它們均可借助大數據實現新的行業增值轉型。例如,麥肯錫預計,美國醫療健康行業每年可以從海量數據中實現超過3000億美元的價值,而善于利用大數據的零售商可以提升約60%的利潤空間。
不過,在水晶石CIO方凡看來,擺在大數據面前的依然有很多難題。比如在技術層面,企業需要提升計算、存儲和網絡交換等方面的能力,三者不可偏廢。此外,一旦針對大數據的業務需求呈現波峰波谷的巨大落差,企業將面臨兩難的選擇——不投資IT基礎設施,將無法應對挑戰,而如果做了投資,業務量一旦下滑,前期的投資會打了水漂,這是一個需要仔細拿捏權衡的難題。
“大數據不是一夜之間產生的,CIO的最大任務就是貼近業務的發展需求,用最少的投資滿足企業最大限度的發展需求。”方凡稱。
相關文章:
2.大數據基礎知識