網上有很多關于什么是大pos機,你敢說你真的知道啥玩意兒是大數據嗎的知識,也有很多人為大家解答關于什么是大pos機的問題,今天pos機之家(www.tonybus.com)為大家整理了關于這方面的知識,讓我們一起來看下吧!
本文目錄一覽:
1、什么是大pos機
什么是大pos機
本次品途網邀請到聯想研究院大數據方向負責人郭煒為大家分享,分享主題是關于DT時代大數據技術。
嘉賓簡介:郭煒,現任聯想研究院大數據方向負責人,畢業于北京大學,曾任萬達電商數據部總經理、曾在中金、IBM、Teradata公司擔任大數據方向重要崗位。在智能Wi-Fi, Beacon等O2O智能硬件方案以及O2O大數據采集、處理、挖掘、應用具有豐富的理論和實踐經驗,多次在CIO論壇、O2O論壇、創業論壇發表相關演講,在傳統行業和互聯網行業享有盛譽。
以下是郭總分享原文(有刪節)
大家晚上好,我是郭煒。今天想跟大家分享一下在大數據下面的一些我的見解過去遇到的一些情況和經驗,那么主要分幾部分。
第一是當前大數據現狀,我會給大家去分析一下現在的大數據趨勢,然后是O2O領域怎么去建立大數據平臺,最后分享下我所觀察到的大數據的未來的一些趨勢。
大數據現狀
先從大數據現狀分析開始,先給大家看一張圖。
其實大數據這個概念現在被大家炒的非常火,好像說到統計都要說是由大數據統計出來的,所有的無論網絡金融,還是相關的O2O,還是我們的所有企業都在說自己在做大數據平臺。那么什么是大數據呢,其實我覺得現在有好多專家有各式各樣的定義,我覺得其實這個大數據不是一個特別新鮮的東西,就像我在這個圖里面給大家劃分出來的,數據和大數據是產生很多年積累的概念。
馬云提到說未來是一個DT時代,不是IT時代。那么他是說將來會在任何方面都會產生數據和大數據來決策、影響我們相關的一些生活,那么其實這個所謂的DT,最早的時候是叫做數據倉庫,在大概十五年到二十年前它就已經出現在國外,那么在1998年到兩千年左右開始引入到國內。
在那個時候把它叫做ERP和CRM時代,都是一些企業內部的一些系統比如客戶關系管理、庫存管理、購銷存等等,各個模塊其實那個時候就積累了相當多的一些數據,那么像銀行像電信那么投入非常大的一些資金來去做數據倉庫,當時叫做數據倉庫,其實它也是把我們現在所謂的大數據的這些詳單,也都收錄在過去的關系型的數據庫里,那么就形成了它的數據倉庫。
那么在數據倉庫之上,當時也有一些概念叫做數據挖掘。其實也是基于收集到的客戶的詳單,然后找到這個所有數據之間的相關性。還有包括像客戶流失分析、交叉銷售,以及當時最著名的一個案例啤酒和尿片案例。講的是沃爾瑪經過相關性分析發現所有的男顧客在買啤酒的時候,經常會買尿片兒,那么這個現象很奇怪。后來經過調研發現這一般都是妻子讓自己的愛人去商店買尿布,孩子在家已經沒尿片兒了,于是沃爾瑪就把尿片放在啤酒旁邊,然后這個啤酒銷量和整體客流量都有很好的變化。這個故事其實就是發生在那個ERP和CRM時代,當時其實已經有數據分析和數據推薦的味道,只不過發生在純線下時代,所以我把它叫做ERP和CRM的時代。
在這之后,互聯網興起,包括各大的門戶網站,包括像谷歌、雅虎這些全部都發展起來了,那么國內的BAT三家也發展起來了,這個時候的就不僅僅是過去我們所謂的交易和這些銀行的流水這些數據了。這個時代,其實是主要是以我們的WEB,網絡日志以及搜索引擎而產生的搜索關鍵詞,或者是APP產生的點擊流,產生了這樣的數據。那么在這個時代,我把它叫做WEB2.0時代,我們這個時代其實是因為過去的時候,它的所有過去的技術全都是在處理關系型,還有這種交易類的數據,在這個時代它開始處理的非結構化的數據,比較著名一些品牌像HADOOP開始興起,現在基本上很多的人在做的時候都會說,大數據是什么,要建大數據平臺必須建HADOOP。
最典型的就是在所有的這些搜索引擎的網站、電商網站,最終它會給個人消費者開始做一些推薦的工作,比如說猜你喜歡或者是做一些定時提醒等等,這些東西其實都是在幫助最終的消費者來做一些新的一些購買決策,或者是你在搜索的時候幫你做下廣告的推薦,這個時代其實叫做2.0時代。
那么在最后,現在這個時代我管他叫IOT和O2O時代。它和過去三個時代差別在哪兒呢?大家可以看到在第一個時代所有的這些數據其實都是企業內部的數據,它的產生是由客戶產生,數據的消費這些數據的人,一般是企業內部的所謂的決策層,做一些決策支持,做一些數據分析、報表,只是少數人去分享,在第一個ERP時代大家都叫它BI。
在WEB2.0時代,其實是有個人的消費者產生數據,根據我們的點擊情況,把這些數據采集,再根據你的推薦引擎重新推薦給消費者去方便購買,這個時代其實是在WEB2.0時代。
在IOT和O2O時代比較有代表性的比如說像現在做了很多的智能Wi-Fi,那么也有現在的炒的比較火的Beacon的技術。那么也包括現在咱們手機上的各個傳感器去采集的相關數據,也包括現在像蘋果PC上面去采集的相關數據,那么還包括像我們的手環、智能家居,甚至于機器人,包括我們現在線下見到的,這些硬件去采集來的數據,那么它的數據已經不是過去的這些網絡日志。而是除了網絡日志之外的,比如說我們的線下行為軌跡流。比如說我們視頻別人,比如說我們的經濟數據等等,這些所有這些相關的數據,那么當這些數據來臨的時候,過去其實在WEB2.0的一些技術,又不能完全的去滿足現狀。
舉個例子比如說在WEB2.0的時候可能大家談的最多的還都是HADOOP,HADOOP其實是做批量分析來去幫你做一個推薦,可能是留數據挖掘模型,在WEB2.0時代已經不能滿足需求了。
其實是因為現在O2O的時代,我們需要的是實時的大數據,我們需要的是實時的能給客戶做出根據過去的行為和他現在所在的位置,來去給他做相關的一個推薦或者是一個推送,或者是指導這樣一個工作,所以在這個時代有很多新的大數據的技術產生。那么結合新的智能硬件,會產生一個完全和WEB2.0和SAM不同的時代,那么這個時代其實就是O2O的大數據時代。
所以我整體分析來看呢,不同的時代我們從這個消費者的距離來看,原來最開始的這個ERP時代到WEB2.0到O2O這個時代。距離消費者的數據是由遠到近的,從數據的影響力來講,在過去只是給終端的領導決策層,現在時時融入到生活當中。會發現數據對整個業務的影響比例由弱到強,隨著技術的發展會給最終用戶一個全新完全不同的體驗。
我給大家分享兩個我的個人畫像,這個畫像其實是在過去在某商業地產的時候給給我自己畫出來的那么其中一個畫線了,左側的藍色的那個畫像,其實是我自己一個人的一個線下的行為軌跡流。
其實它是通過我自己在廣場里面,在每一個這個門店的行走的軌跡來去捕捉我自己在線下的行為的情況??梢钥吹秸f我是經常會去九毛九去吃飯,然后我在那邊會經??催@個影城的一些電影,我會經常去KTV。能看到這里面所有的這些這個小的字其實都是我過去在我線下的軌跡來給我個人畫出一個畫像。那么,這就是我剛才提到說在ITO和O2O時代每一個人其實優過去的在WEB2.0的這種點擊流變成了我們現在線下的這種軌跡流了。
我們能把每一個人在這個廣場里面,這個所有的消費的記錄,全部都找到,每條明細全部都能夠無論你是用是哪個商家的終端,那么通過的只能智能POSS我們全部等都能把你的消費消費的明細,全部是是拿到云端。
拿到了這些數據和我們干什么呢,其實我在那個時候做了一個叫做場景引擎的東西。那就是一個類似一個虛擬的人陪你一起在逛這個萬達廣場,站在你進入萬達廣場的那個時候,我會請一個實時的進程去跟蹤你的狀態。你買的什么東西,走到哪里,然后給你推薦你想要的東西!比如我剛從一個電影從院線的電影在剛剛走出來,這個虛擬進程會監控到會看到你從電影院里走出來我會知道你是星巴克的一個愛好者,那么我其實在這個時候就可以給你這兩個優惠券讓你去到星巴克去。
這樣其實更能夠根據你現在此時此刻此地,你現在的狀態和你過去的行為的一個偏好給你推一個優惠這樣的話就能夠讓促成一筆新的交易,那這些東西其實是在新的IOT和O2O時代,那么其實是和WEB2.0時代是完全不同的。
那在這里了我再給大家分享一個現在新的時代下,我們和客戶為中心的這樣一個整體的一個大數據的一個閉環,它會是什么樣的呢?
那么大家知道,剛才我提到在新的現在的IOT和O2O時代的來臨以后其實它的各種技術已經發展到一個和過去的WEB2.0時代的大數據技術已經完全有些不同了,那么它會體現在幾方面,一看的是剛才提到的智能硬件,那么第二個大家知道最近很多人都聽過深度學習這個概念。那么其實隨著深度學習和自然語言算法的更新,那么實現了一件什么事情呢,我們現在的電腦,它可以理解你說的一些話。所以當這件事情發生的時候我們可以發現說,在整個目前的和用戶交互當中所產生的無論是線上我們用戶的對話,還是線下用戶打的客戶熱線的內容,其實我們都可以完全能夠理解他。
這樣的話其實在整個這個閉環里面大家可以看到從客戶對這個品牌的感知到他線下產品的選擇購買到使用到服務到創新,這一系列的這個過程其實在大數據的幫助下他都發生一些變化,那么分別大概跟大家講講。
比如說這個品牌感知,剛才我提到說這個自然語言和大數據能夠直接和他一起,你會發現過去的所有的這些用戶到底說了些什么?用戶在論壇上關注什么?過去其實是很難知道?,F在其實你對你這個品牌,用戶怎么去交互,她在網絡上的評論論壇怎么說,你很快的就能夠通過很容易的一種方式能跟你展現出來,那么在線下再做產品選擇剛才我提到Beacon、 Wi-Fi技術,視頻技術,其實完全可以能夠知道用戶在線上的這些產品,他究竟是怎么樣去選擇了,然后你完全能知道和競爭對手究竟是什么樣的區別。
在用戶購買的時候我們也能夠做到比較好的用戶購買的畫像,包括他的購買線上線下的購買的路徑。其實一切都可以完全在我們當前的這個大數據的覆蓋了內容里面,我們可以做相關的這個分析也可以給用戶做相關的推薦等等。
整個用戶怎么去使用你的這個產品,無論你是智能家具也好你是手環也好好。而在過去的時候可能還沒有這些東西大家都知道只是在互聯網上的網絡日志,現在通過新的這個智能設備和智能控制芯片的加入,他怎么去使用你的這些芯片怎么要去使用電腦,怎樣去使用空調,廠家或者商家都可能拿到。
基于這些我們會直接能夠看到說,我們用戶的服務當中會出現了哪些問題,他怎么樣去就跟你交互,哪些地方需要提高。也可以去做很多的這個業務的創新,比如說我們做一些用戶的分析,也許我們還可以做一些其他的這個數據變現,這些全都是根據現在整體上面以用戶為中心來做,所以我經常提一句話,我說DT會讓這個商業回歸本源,那本源是什么,其實這就是過去和這個用戶和商家做買賣的時候面對面的這樣的過程。現在能夠讓企業,無論多大,無論賣什么東西,通過DT的技術又可以重回到那個直接面向你最終用戶的這樣一個形態。
大數據平臺建立方案
前面的是跟大家聊了一下在新的O2O和IOT這個環境下我們大數據的一些新的技術和一些新的發展,那么下面的我跟大家聊聊這個創業企業的一些大數據里方案的一些討論。
其實這個問題是由過去我的一些朋友經常在問我說,都是O2O和一些創業企業。那么他在融資以后就會想說我們要建一個大數據平臺,經常問我技術方案是怎樣的?
其實我的觀點是這樣,所有的大數據和這個技術其實都是為你的業務服務的。所以總體上不要為了大數據而大數據,那么我大概有個簡單的給做它做了一個區分。我把它分為按照PV來算,那么是一個是PV少于五十萬的時候,PV這個少于一千萬的時候,和PV大于五千萬的時候,可以大致這么區分。
那么我一般在給大家介紹首其實PV五十萬以下的這些企業,對他們來講我覺得其實他不太需要大數據平臺。那么他真的如果需要去做這個無論APP或者是網頁或者是剛才我提到的這些數據分析的時候,其實完全可以用傳統的數據庫的形式加上傳統ETL的模式,加上一些開源的LOG的分析工具,完全可以滿足他現有的一些分析需求。那么整體的解決方案加上固雇傭相關的人,那一年也不會超過五十萬。
而如果在我們的PV處于五十萬到一千萬的時候,這個時候要考慮些建立一些大數據平臺。但是在現在這個環境下的我的建議是,如果可以的話,在這個時代你的企業還不是特別穩定的時候,你可以考慮一些云服務的方式,來建設大數據平臺來滿足你的業務的需要。因為在這個時候其實你的大數據積累和最終的這個需求還不是那么的明確,你的變化還是比較大,那你這時候你如果去雇傭相關的大數據人才和相關建立相關的硬件,你的投入可能會非常高。在這個時候,你還是會盡量考慮節約自己的資源,如果真的要建HADOOP這樣的平臺,也不要建超過十個節點的平臺,一般十個節點的平臺就足夠,但是需要幾個JAVA的工程師幫助。
但是如果當你的PV到一千萬以上,這個時候你就會需要去做一個決策,的確是需要建立你自己的這個平臺了,你的相關的推薦服務也需要。現在目前在這個新的這個時代下,在這個最新的這個領域里,我還是推薦除了HADOOP之外我會推薦SPARK這個實時數據計算的平臺,它在覆蓋目前你的企業里面IOT和O2O的相關的一些服務,實時運算能你滿足你至少在未來的一段時間的需求,它的數據量的增長,隨著你的機器數量增長,你的機器其實是可以有評估基礎,然后你再去建相關的平臺。
當然如果這個時候你的日pv已經過億了,這個時候其實你是需要一個不同的一個領域,那么你需要的東西,是要做一些自主優化的數據存儲和你的一個云數據的處理一個平臺和中心。而且你要去定制你自己的處理平臺和你的數據分析平臺在這個時候一般來講,比較高級的這些技術人員是你必須要準備,因為你會面臨著直接修改HADOOP和這種SPARK源碼的需求,否則你沒辦法支持你的業務發展。
大數據發展的幾個趨勢
那么接下來我也大概給大家分享一下我我所看到的未來的這個大數據發展幾個趨勢。
一個趨勢是我認為未來的大數據會迅速的形成大數據聯盟。這個可能在以前也跟一些分享的時候跟大家講過,因為在過去的時候大家總是在說這個企業自己內部有這個信息孤島,而不能把數據打通,現在其實在經過這樣的這個技術的一些革新后企業內部基本上都是大一統的。但是,企業自己變成了這個孤島,所以企業在大數據的環境下那如果要他以用戶為中心,那么它一定是要形成一些大數據聯盟的,這種聯盟可以通過這種數據復合購買,也可以通過其他并購,也可以通過數據的交換。所以能看到最近很多的并購的案例啟示背后,都是有大數據的交換來作為他其中的一個幾個重要的并購意向。
第二個我看到的趨勢是說叫大數據的云化。因為在過去的時候其實還有很多企業很難接受自己的數據是在第三方的地方。但是在現在這個環境隨著物聯網的發展,我們的數據過去都是在企業內部。而現在互聯網,我剛才提到O2O和IOT這些數據其實都是在互聯網上的。它的數據采集器是給云的這個數據中心提供了一個機會,就是我們可以在云端提供相關的大數據服務。同時現在的加密技術已經有相關的硬件能夠支持實時的數據加密,所以這些數據處理上的時間也不會有太多的這些代價,能夠讓加密解密能夠在大數據環境下來進行生存。
第三是說比如說我們現在的很多的爬蟲技術,剛才我提到說通過互聯網的聲音來了解我的客戶。那這些數據其實都是在互聯網上面的,也不需要說每個企業自己都要爬整個互聯網。所以提供云服務,其實也是所有的企業眾望所歸。
第四點的就是說我們現在其實這對于這個大數據平臺來講,因為它是開源平臺的,其實到一定程度以后這些開源平臺的一些難點和維護工作量還是挺大。而且現在大數據炒的比較火,相關的高級技術人員他的成本也比較高,所以不是每一個企業都有錢能夠去雇這樣一個人來去做相關的大數據背后的開發,所以也給大數據云平臺提供了機會。
那么今天的我的分享就到這里,謝謝大家,也希望了大數據的技術能幫助各位的企業技術能上更大的一個臺階。
以上就是關于什么是大pos機,你敢說你真的知道啥玩意兒是大數據嗎的知識,后面我們會繼續為大家整理關于什么是大pos機的知識,希望能夠幫助到大家!
