當前位置: 華文星空 > 知識

數位電視機上盒數據能否被「反向收集」成為大數據?

2014-04-03知識

關註了這個問題,也沒敢答,可是兄弟們回答也太不靠譜了。


我是PM,做的就是傳統電視分析收視率、點播、回看的統計軟體

令人欣喜的是—— 我們的收視行為已經可以被大數據記錄,成為最佳化節目制作的小白鼠了!


數位電視機上盒的數據,目前是有收集的。別把傳統行業想的那麽弱好麽

首先營運商會記錄每個使用者的行為日誌

原始數據

這些日誌分四種:

1 ) 使用者資訊日誌

2)收視日誌

3)訂購消費日誌

4)節目數據

你還記得你辦理數位電視機上盒的時候填寫的聯系方式和姓名的,對的,沒有錯,那個就是使用者資訊的日誌。

其他具體的日誌內容呢,我就不多說了,差不多有一百多項的統計欄位.

分別會把你看了什麽,看了多少次,點播了什麽,回看了什麽,購買了什麽統統記錄下來

日誌呢也統計的很細,會精確到秒級的數據

這個是原始的數據,透過原始數據我們可以得到使用者行為的分析啦,可以看到哪些節目觀眾比較喜歡,哪些頻道比較受歡迎。甚至還可以分析到使用者都是從哪些頻道流失到了哪些頻道。

自主采集

還有一種呢,就是題主說的使用者操作過程反向收集,這個可以實作,需要在數位電視機上盒系統內嵌入程式碼

,你可以想象一下網頁檢測每個頁面被點選的過程。你進入到了哪個界面,點選了哪些東西,都是在做什麽操作。

但是呢,這個檢測還比較弱,還不能做到與我們的網站統計軟體一樣分析出使用者的行為習慣,所以這邊面我們也會努力的!!!

數據分析

這些數據呢可以為我們提供寶貴的分析源,下圖是某頻道的線上人數

透過對節目單的對比,我們可以發現該頻道每天晚上是放兩個電影,所以導致了這樣的線上人數,對的你沒有猜錯,這是CCTV6!

想一想,對比一下就知道哪天的電影受歡迎了有沒有。


在處理數據的過程中,會有很多雍余的數據出現,例如你去睡覺了,數位電視機上盒沒關。這種數據就是我們說的臟數據.

當然,我們已經有了一些學習與進步,在處理數據的時候會有一些判斷,能夠使數據變得更精準,如何清洗掉無用的數據也是一個重要的因素.

大數據

最後,我們說大數據,並不單單是說數據足夠大就叫大數據,我們透過對一個節目在多個平台的播放情況進行監測與分析,我們透過對各個渠道觀眾的畫像與剖析。

最終我們得出一些有用的結論幫助我們讓節目制作的更好,那才是我們的目標!

網上也有很多現成的例子,我就不多做解釋了,大家有興趣可以去搜一搜類似小時代的受眾群體,龍門鏢局的受眾群體等等,這些我們都是可以透過實打實的數據來分析出來,當我們的數位電視機上盒統計足夠完善的時候,真正的的可以透過大數據來為節目與電影的制作做出決策參考之一.

目前我們的系統也已經開發了1.0版本,已經對一些節目的制作提供了幫助,希望以後可以越來月完善!

關於收視率

至於另外一些朋友說的,收視率的問題,具體的收視率如何采集請點選:

電視節目的收視率如何計算?

一些傳統的巨頭不能代表整個行業,目前誰來做收視率都是會受到質疑。

很多人腦都不能衡量數據交給機器來分析我覺得會更困難,所以一些機器分析的結果有時候還需要透過發問卷來驗證。