点击蓝色
关注我们
一
背景介绍
1.1
关于脱口秀行业的介绍
脱口秀(TALK SHOW,中文名为英文音译得来),一种由观众聚集在一起讨论主持人提出的话题的广播或电视类谈话节目,主要发源于欧美地区,后续发展形式多样,是目前比较流行的一种喜剧类型。
脱口秀在国内的发展经历了四个阶段,各阶段的特点及其代表节目如下所示:
在2010年之前,脱口秀主要是以电视节目为依托,整个行业处于初步探索阶段,经营模式比较零散。2010年开始脱口秀厂牌(俱乐部)的概念逐渐兴起,厂牌的形式使得脱口秀演员们可以一起交流、共同创作,为脱口秀后续发展的规模化、规范化奠定了基础。
“北京脱口秀俱乐部”是北京乃至全国最早成立的厂牌,很多脱口秀演员都是从这个厂牌出来的,之后随着脱口秀行业的发展壮大,在全国各地都建立了具有当地特色的厂牌。目前为止发展得最好的厂牌代表是上海的“笑果工厂”和北京的“单立人”。
随着社会经济的发展和生活节奏的加快,人们对于精神层面消费的重视程度越来越高,以脱口秀为代表的的文化类消费市场的空间逐步壮大。 从CBNData联合笑果文化公司发布的《中国年轻态喜剧受众消费大数据报告》来看,目前国内的脱口秀受众在年龄分布、职业分布和收入状况呈现以下特点:
消费受众以18岁-29岁为主体,女性受众中18-29岁的年轻人占比为65%,男性受众中18-29岁的年轻人占比为56%,说明脱口秀消费结构呈现年轻态现象。
受众的职业分布主要集中在公司中高层管理人员和普通职员,这一类受众有着稳定的收入来源,收入都相对可观,对于文化类产品的消费能力较强。
1.2
关于脱口秀大会节目的介绍
《脱口秀大会》是由企鹅影视、上海笑果文化传媒有限公司联合出品的脱口秀对战节目,截止2021年,《脱口秀大会》一共举办了四季,第一季于2017年播出,对比四季的播放量,可以看出第一季和第二季的播放量都处于较低水平,但第一季有两个异常值,主要是因为当年两个较为重大的娱乐事件的流量导致的,第3期是“沈梦辰和杜海涛恋情曝光”,第7期是“俞灏明烧伤后复出综艺首秀”。第三季和第四季的每期播放量都维持在较高水平,相比于前两季几乎翻倍。
在搜索指数上,可以明显看到每一季的整体热度水平呈现逐步增加的趋势,第三季和第四季的热度指数显著高于前两季,说明脱口秀大会这个节目在经历了前两季的铺垫后,从第三季开始逐渐火了起来。
在《脱口秀大会第四季》播出期间,网络综艺播放指数的排名中,除了8月25日这一期的热度排名是第五,其余期数的热度都是第一名。
随着《脱口秀大会》第三季和第四季节目的播出,大部分脱口秀演员逐渐被大众所熟知,甚至部分演员出现了爆火出圈的现象。比如因为吐槽男女话题出名的杨笠,具有高学历、高颜值的庞博,胜负欲极高的小浣熊呼兰,低配版周杰伦的何广智。这些演员在参加节目之前都是籍籍无名,而参加节目后凭借自己的努力成为了炙手可热的脱口秀明星。
同时,能够反映《脱口秀大会》火起来的还有微博热搜数,第三季和第四季的热搜:第三季平均每期上热搜7.2个,第四季平均每期上热搜11.3个;第三季热搜主要来自杨笠、王建国、李雪琴等;第四季则来自于杨笠、周奇墨、庞博、呼兰等;两季中,杨笠的热搜数都是最高的。
出于对脱口秀这个新兴行业发展历程的关注,以及大多数脱口秀演员逐步火起来的这个现象,本次案例想要探究的是脱口秀演员是如何火起来的?在后续的分析中,主要分为两个部分:一是研究当前脱口秀行业中演员们的热度排名,对当前市场有明确认知;二是探索演员热度的影响因素,对演员如何提升自己的热度有借鉴意义。
二
数据说明
2.1
分析对象
本次分析对象是脱口秀大会第四季的参赛选手,本季共56名参赛选手,但由于一轮游的选手可供分析的信息太少,所以最终选取第一期成功晋级的28名选手,即所分析的每一名选手在该节目中都至少有两场脱口秀表演。
2.2
变量选取及描述统计
在针对热度成因进行分析时,我们选取并收集了11个相关自变量的数据,所有自变量展示如下:
其中表演年限、出场期数、是否签约、是否组CP、是否参加过第三季、平均表演时长和文稿长度等变量都是从选手个人相关信息及脱口秀比赛节目数据中直接获取的。
关于情感得分,我们选取每人2-3篇脱口秀稿子,使用python的snowNLP包,逐句放入进行情感打分,最后求均值。人设鲜明度是通过观众评论得到的,我们共爬取腾讯视频评论共三万多条,豆瓣评论2000条,筛选与演员无关的评论后,保留有效评论21290条, 对每个演员相关评论制作词云图。以下是效果较好的选手(周奇墨、杨笠和王勉)相关词云图展示:
周奇墨词云图
杨笠词云图
王勉词云图
我们计算词云中前10出现的词汇频次占前30词汇总频次的比例,再对结果进行标准化处理,得到最终的演员鲜明度得分,得分越高,说明观众对于这个演员的印象越深刻。原始词汇频次占比得分最大是周奇墨,所以他标准化后鲜明度为1,紧随其后的是王勉、程璐及何广智。下面是演员鲜明度得分的柱状图:
评论数和观众认可度也是从爬取评论中可以得到的数据。观众认可度通过对各演员的相关评论进行情感分析得到的,有些评论会带一些负面的词汇批评演员,也有些评论是点名表扬的,通过评论表达的情感我们对每一条都进行打分,然后对同个演员的相关评论求均值;观众认可度是反应演员口碑的一个重要指标。
从以上图表可知,与呼兰相关的评论数最多,而杨波的观众平均认可度最高。
三
模型分析
3.1
演员热度分析
本次对于脱口秀演员火爆程度的分析中,我们共选取了四个热度相关变量,分别是微博粉丝数、中插代言数、视频播放量以及搜索结果数。这四个变量能够较为全面地反映一个脱口秀演员“火”的程度。为了方便后续地分析,我们使用熵权法对这四个因变量建立一个综合评价体系,分别赋予其不同的权重,最后计算每个演员的综合得分。
熵权法的基本思想是根据指标地变异性大小来确定客观权重。
一般来说,若某个指标的信息熵越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵越大,表明指标值得变异程度越小,提供的信息量也越少,在综合评价中所起到的作用也越小,其权重也就越小。其中信息量实际上是事物发生概率的倒数取对数后的结果,代表着了解一个事物需要获取的信息的大小。信息熵则是信息量的期望,代表着一种不确定性的大小。基于该思想,我们计算了各因变量的权重大小。
由于量纲的不同,需要先对数据进行标准化操作。同时因变量均为正向指标(若指标的数值越大,代表结果越好即为正向指标;反之则为负向指标),因此不需要进行负向指标转换的操作。
标准化后,计算每个变量下的每个样本值占该变量全部样本值的比例,该步骤实际上计算的即为前文提到的信息量的概念。
基于此,计算各变量的信息熵,
通过信息熵便可以计算各指标的权重:
最终基于标准化后的数据得到综合得分:
在我们的分析中,基于以上步骤所计算得到的各变量的权重如下:
最终,根据以上权重大小,计算得到各演员在四个因变量上所得的综合得分。按综合得分进行降序排序后,发现得分较高的演员正是实际当中较火的演员,而得分较低的演员也正是实际当中受到关注度较低的演员。
后续将使用该综合得分进行分析,所得到的演员热度排名如下:
演员热度排名前三的分别是:庞博、杨笠和王勉。
(1)TOP1:庞博
• 上海交通大学计算机系毕业
• 《脱口秀大会第一季》冠军
• 微博粉丝292万
• 经典段子:
大家在书上学过的那个红绿色盲他就是红色跟绿色分不清楚,然后再严重一点就是全色盲,看所有东西都是黑白灰的,如果再严重一点就是黑白都不分的,他就是一部分的微博网友。
(2)TOP2:杨笠
• 2018年加入笑果文化
• 参加了《脱口秀大会》第2、3、4、5季的录制
• 微博粉丝234万
• 经典段子:
问我为什么不找男朋友?那你为啥不上清华呢?是不喜欢吗?
男生为什么明明看起来这么普通,但是他们却可以那么自信!
(3)TOP3:王勉
• 《脱口秀大会》第三季冠军
• 参加2022年春晚
• 微博粉丝250万
• 经典段子:
我把QQ昵称改成,你的名字,签名也改成你最爱的歌词,我把QQ秀设计成,你的样子,于是你注意到了我,还举报我是冒充你的骗子。
3.2
因子分析
对于演员数据做因子分析,探究影响脱口秀演员热度的主要因素。
首先绘制特征热力图如下:
可见大多数特征之间的相关性是比较强的。
接着做KMO检验和Bartlett球形检验,检验结果如下:
根据检验结果,当前数据符合做因子分析的条件。为确定因子数,我们绘制碎石图如下:
从图中可知,候选因子数为4、5、6。经实验验证因子数为5时模型效果最好。故选定因子数为5。当因子数为5时,计算因子载荷矩阵如下:
“因子0”主要对应于出场期数、平均表演时长、文稿长度、相关评论数、人设鲜明度等特征,故命名为“曝光因子”;
“因子1”主要对应于表演年限、是否签约、是否参加S3(即是否参加了第三季)等特征,故命名为“经验因子”;
“因子2”主要对应于观众认可度特征,故命名为“观众认可因子”;
“因子3”主要对应于文稿情感得分特征,故命名为“文稿因子”;
“因子4”主要对应于是否组CP特征,故命名为“CP因子”。
3.3
聚类分析
通过因子分析可以得到每个演员对应的因子得分,根据因子得分,对所有的演员做Kmeans聚类,利用手肘法,我们确定K=5。
以聚类数k=5进行实验,即将所有的演员聚为5类,为了直观地展示各类演员之间的异同,我们绘制因子得分热力图,并根据类别进行分割:
每一类的命名及代表人物如下:
• CP炒作类选手,代表人物为呼兰
• 文稿励志选手,代表人物为小佳
• 经验丰富选手,代表人物为程璐
• 高曝光度选手,代表人物为庞博
• 平平无奇选手,代表人物为赵晓卉
同时,还可以计算每一类演员的平均综合热度,得到聚类中心特征如下:
从上图可知:CP炒作选手和高曝光度选手的综合热度最高,文稿励志选手和经验丰富选手热度居中,平平无奇选手的综合热度最低。
基于以上分析,可以给脱口秀演员提出几点建议:
• 要么多制造话题,提高曝光度,要么找个选手组CP或者制造舆论
•依靠文本的积极性,给观众带来治愈也是有一定效果的
• 最次也可以尝试“笨鸟先飞”,积累足够的经验,热度也会上去
千万不能平平无奇什么特点也没有,要想办法给观众留下印象
五
结论总结
4.1
工作总结
本案例首先基于前期收集整理得到的脱口秀演员的相关数据,通过特征工程来提取出若干合适的特征变量,用于后续的建模分析。一方面利用熵权法来计算综合热度,可以计算出每个脱口秀演员的热度得分,进而可以得到演员热度排名;另一方面,先利用因子分析对特征变量进行降维,再结合聚类方法来探索影响脱口秀演员热度的相关因素。
4.2
研究结论
通过前面的建模分析,我们可以总结出一个用于估算演员预期热度的公式,人设鲜明度+组CP+曝光度+文稿=高热度。该公式在一定程度上可用于指导演员,通过调整自身的脱口秀风格来改变观众心中的热度得分。
在人设鲜明度维度,对于新老脱口秀演员需要采用不同的方法。老演员通常建立起了一定的个人脱口秀风格和人设,并积累了一定的观众认知度。通过维持并强化人设的方式,一方面维系与原受众的联系,另一方面也要逐渐扩充自己的受众圈层,从而提升自己的热度排名。对新演员来说,由于台风尚未成型,通过树立一些新颖的人设,增强在观众心中的印象,或许能取得更好的成绩。
在组CP方面,打造CP的核心在于利用脱口秀演员双方的联动,一方面可以使双方的粉丝可以互相融合,另一方面也更容易制造出圈的话题,吸引新粉丝。对于新演员尤其如此,通过与知名脱口秀演员组CP,如果方式得当,也能快速增强在观众心中的印象,积累自己的粉丝。当然,也不宜强行组CP,如果方法有失妥当,也可能适得其反,引起对方粉丝的反感,可能还会造成一定的公关危机,败坏路人缘。
在曝光度方面,提升热度的关键在于增加曝光,一方面靠粉丝的自发推广,另一方面也要靠合适的营销手段,主动制造热点来吸引观众。如可以多参与各种适合自身的综艺节目,依靠节目自身的流量优势,能够更好的增加曝光机会。
在文稿方面,文稿可以说是作为脱口秀演员的立足之本之一,好的文稿搭配恰到好处的表演方式才能取得最好的表演效果。对于新演员来说,可以通过标新立异的文稿,给到观众新鲜感,能够获得观众认知;也可以结合热点事件来给出独特的见解,激发观众的共鸣,也能增强观众的认可度。
综上所述,本案例的研究意义主要分为两个方面:对于演员而言,可以根据自身特质快速判断适合转型的方向,帮助打造出适合自己的演出风格;对于观众而言,则可以快速地了解自身偏爱的脱口秀演员的类型,也能比较快速地了解其他类型演员的大致特征,增加对脱口秀风格的理解。
狗熊会特别感谢为本案例提供宝贵素材和为案例重新整理加工提供帮助的小伙伴:来自中国人民大学统计学院的康蓝月,章程程,胡帅帅,聂大庆,刘建华。
狗熊会还特别感谢为案例提供审查帮助的小伙伴:来自厦门大学的高天辰同学。
本案例为狗熊会精品案例库收录。狗熊会精品案例库为狗熊会核心商业产品,目前收录了超过100个案例,包括探索性数据分析、回归分析、机器学习、文本分析、时间序列分析等模块,涉及电商、金融、餐饮等行业。狠戳阅读原文,查看狗熊会精品案例库。狗熊会精品案例库面向机构收费授权开放,有意洽谈者,请加熊二微信clubear2详细沟通。
点击此处“阅读全文”查看更多内容 返回搜狐,查看更多