- · 《产业创新研究》收稿方[05/28]
- · 《产业创新研究》投稿方[05/28]
- · 《产业创新研究》征稿要[05/28]
- · 《产业创新研究》刊物宗[05/28]
“大数据”如何驱动电影产业创新
作者:网站采编关键词:
摘要:2013年,全球影业“大数据”热潮持续升温。6月谷歌发布了《用谷歌搜索量化电影魔力》白皮书,立刻触发了一系列有关“大数据”驱动影业创新的讨论。与此同时,中国影业捷报频传
2013年,全球影业“大数据”热潮持续升温。6月谷歌发布了《用谷歌搜索量化电影魔力》白皮书,立刻触发了一系列有关“大数据”驱动影业创新的讨论。与此同时,中国影业捷报频传,上半年累计票房已突破百亿大关,数部热映影片都受到了各界高度关注,“大数据”在新片营销中的表现也可圈可点。在此背景下,笔者以引介谷歌白皮书为支点切入主题,首先分享国际前沿研究的主要成果,接着详细阐述了“大数据”对电影产业各环节的量化支撑作用所在。最后回到国内现实,指出在国内畅谈“大数据”易,做实“大数据”难,中国影企要落实“大数据”战略还存在诸多困难,现在谈影业“大数据”繁荣的确为时尚早。
一、引子:用谷歌搜索量化电影魔力
2013年6月,谷歌的媒体与娱乐业首席分析师Andrea Chen与Reggie Panaligan联合发布了《用谷歌搜索量化电影魔力》(Quantifying Movie Magic with Google Search[1])白皮书。该报告以2012年间美国上映的近百部电影为研究对象,分析了影片上映前各时间段里用户对各类电影信息的搜索行为数据,揭示了电影相关搜索量与电影票房成绩间存在的强相关性(见图1、图2),构建了利用搜索数据预测电影票房的数学模型,并据此提出了若干利用搜索优化电影营销策略的实操建议。由于谷歌在“大数据”时代处于全球领先地位,该报告一经发布,旋即引发热议,有关“大数据”如何影响电影产业发展的讨论一时间成为舆论焦点。
具体而言,白皮书主要发现包括:①观影是一个需要信息搜索辅助决策的过程,其中数字渠道所起到的作用越来越大。2012年谷歌上电影相关信息的搜索量较2011年增长了56%,显示出用户观影决策过程中搜索引擎服务使用率的增长趋势。②通过分析潜在观影者的信息搜索内容与方式,搜索引擎服务可以帮助电影营销者更好地理解用户的注意力与意图所在,为其拓展用户互动空间提供独特价值。③通过查询量、关键字广告点击量,结合其它电影相关变量(如电影院数量、电影类型、是否属于特许经营类电影等),可预测某部电影首映周末票房,其准确率可达92%。利用该模型预测随后一周的周末票房,准确率也可达90%。利用该模型测算发现,在新片上映的7日之内,若某影片比同类影片的搜索量高出25万次,其票房收入要高出430万美元;若它的关键字广告点击量能高出同类影片2万次,那么它的票房收入则高出750万美元。④新片首映前四周电影预告片搜索趋势与首映周末票房成绩之间存在强相关性。结合谷歌上电影预告片的搜索量、电影特许经营状况以及季节性因素,可预测新片首映周末的票房成绩,其准确率高达94%。⑤由于48%的观影者会在决定去看哪部影片的当天购票,因此电影推广应在首映周末后再持续一段时间,而不应止于首映。首映之后周一至周四这段时间里,付费广告点击率是衡量影片能否持续卖座的重要指标之一。
图1:2012年电影票房与电影信息搜索量之间的强相关性(数据来源:谷歌)
图2:电影票房、片名搜索、非片名类电影信息搜索三者的关联(数据来源:谷歌)
长期以来,票房收入预测在电影业界都是个至关重要的终极命题,它贯穿和影响着电影生产的各个环节,自然也是从业人员迫切需要解决的现实问题。而随着社会意识形态与消费方式日趋多元,信息生产与消费方式已发生巨变,观影决策过程变得更加复杂,量化票房需要考虑的因素更加复杂,利用传统思维与调查手段来解答上述问题却愈发捉襟见肘。谷歌利用用户网络搜索数据进行票房预测,一定程度上验证了利用“大数据”量化电影魔力的可行性。但这个案例只是冰山一角,“大数据”对电影产业的影响并不仅仅止步于此。
二、全景:“大数据”对电影业的量化支撑
一般意义上,“大数据”是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。业界将其特征归纳为4个 V,即Volume(体量浩大)、Variety(模态繁多)、Velocity(快速生成)和Value(价值巨大但利用密度很低)[2]。从“大数据”中挖掘更多价值,需要灵活运用多学科方法,目前源于统计学、计算机科学、应用数学和经济学等领域的技术已被开发并应用于“大数据”的整合、处理、分析和可视化。其关键技术主要包括:A/B测试、关联规则挖掘、分类、数据聚类、众包、数据融合和集成、数据挖掘、集成学习、遗传算法、机器学习、自然语言处理、神经网络、神经分析、优化、模式识别、预测模型、回归、情绪分析、信号处理、空间分析、统计、监督式学习、无监督式学习、模拟、时间序列分析、时间序列预测模型、可视化技术等[3]。
文章来源:《产业创新研究》 网址: http://www.cycxyj.cn/qikandaodu/2021/0121/1140.html