当前位置: 华文星空 > 知识

机顶盒数据能否被「反向收集」成为大数据?

2014-04-03知识

关注了这个问题,也没敢答,可是兄弟们回答也太不靠谱了。


我是PM,做的就是传统电视分析收视率、点播、回看的统计软件

令人欣喜的是—— 我们的收视行为已经可以被大数据记录,成为优化节目制作的小白鼠了!


机顶盒的数据,目前是有收集的。别把传统行业想的那么弱好么

首先运营商会记录每个用户的行为日志

原始数据

这些日志分四种:

1 ) 用户信息日志

2)收视日志

3)订购消费日志

4)节目数据

你还记得你办理机顶盒的时候填写的联系方式和姓名的,对的,没有错,那个就是用户信息的日志。

其他具体的日志内容呢,我就不多说了,差不多有一百多项的统计字段.

分别会把你看了什么,看了多少次,点播了什么,回看了什么,购买了什么统统记录下来

日志呢也统计的很细,会精确到秒级的数据

这个是原始的数据,通过原始数据我们可以得到用户行为的分析啦,可以看到哪些节目观众比较喜欢,哪些频道比较受欢迎。甚至还可以分析到用户都是从哪些频道流失到了哪些频道。

自主采集

还有一种呢,就是题主说的用户操作过程反向收集,这个可以实现,需要在机顶盒系统内嵌入代码

,你可以想象一下网页检测每个页面被点击的过程。你进入到了哪个界面,点击了哪些东西,都是在做什么操作。

但是呢,这个检测还比较弱,还不能做到与我们的网站统计软件一样分析出用户的行为习惯,所以这边面我们也会努力的!!!

数据分析

这些数据呢可以为我们提供宝贵的分析源,下图是某频道的在线人数

通过对节目单的对比,我们可以发现该频道每天晚上是放两个电影,所以导致了这样的在线人数,对的你没有猜错,这是CCTV6!

想一想,对比一下就知道哪天的电影受欢迎了有没有。


在处理数据的过程中,会有很多雍余的数据出现,例如你去睡觉了,机顶盒没关。这种数据就是我们说的脏数据.

当然,我们已经有了一些学习与进步,在处理数据的时候会有一些判断,能够使数据变得更精准,如何清洗掉无用的数据也是一个重要的因素.

大数据

最后,我们说大数据,并不单单是说数据足够大就叫大数据,我们通过对一个节目在多个平台的播放情况进行监测与分析,我们通过对各个渠道观众的画像与剖析。

最终我们得出一些有用的结论帮助我们让节目制作的更好,那才是我们的目标!

网上也有很多现成的例子,我就不多做解释了,大家有兴趣可以去搜一搜类似小时代的受众群体,龙门镖局的受众群体等等,这些我们都是可以通过实打实的数据来分析出来,当我们的机顶盒统计足够完善的时候,真正的的可以通过大数据来为节目与电影的制作做出决策参考之一.

目前我们的系统也已经开发了1.0版本,已经对一些节目的制作提供了帮助,希望以后可以越来月完善!

关于收视率

至于另外一些朋友说的,收视率的问题,具体的收视率如何采集请点击:

电视节目的收视率如何计算?

一些传统的巨头不能代表整个行业,目前谁来做收视率都是会受到质疑。

很多人脑都不能衡量数据交给机器来分析我觉得会更困难,所以一些机器分析的结果有时候还需要通过发问卷来验证。