当前位置:首页>最新资讯>机器学习预测《我是歌手》第五季决赛全部排名

机器学习预测《我是歌手》第五季决赛全部排名

  • 发布时间:2023-04-19 23:50:29

  • 限时干货下载:添加微信公众号“数据玩家「fbigdata

    回复【2】免费获取「完整数据分析资料,包括SPSS\SAS\SQL\EXCEL\Project!

    来源:原力大数据(id :wislife)


    pre-ipo新三板企业投资机会,请联系微.信.号:6048856



    本周六,第五届《歌手》将迎来最后的歌王之争,前日小岳岳微博证实了受到李健的邀约成为帮帮唱嘉宾,被歌唱事业耽误了的段子手健哥,会和小岳岳来一段怎样的“双口相声”,着实令人期待。


    本届《歌手》的竞演异常激烈,每场都有歌手被淘汰,相信经历了近三个月的追逐,大家心目中都有歌王的人选了吧。我,“南中国听歌最多”的数据分析师,决定用机器学习的方法预测一下本季决赛所有歌手的排名。

    本文作者


    做一次挑战阿里云小"Ai"的预测


    早在去年,阿里云就训练出了一个叫做“小Ai”的机器人来预测《歌手》的冠军,并预测成功,对于此,我要大胆地做一次挑战“小Ai”的预测,使用非实时数据进行“四两拨千斤”的预测,不仅预测出歌王,还要挑战后面各个歌手的排名。

    作为一个拥有5年《歌手》、《好声音》观影经验的天朝人民,我认为夺冠几率与歌手的国籍(地域)、资历及每期比赛的排名十分相关,据此,我从百度百科等网站上整理了大量相关数据。

     《歌手》百度百科

    最后整理出来的数据如下所示:

    数据准备好之后,将基于python的scikit-learn机器学习库作为工具,用到的模型包括:线性回归、决策树、随机森林等。技术细节详见:歌手预测技术篇)

    在进行正式预测之前,我们先来对历届歌手的数据进行探索,看看有哪些意想不到的结果。

    用数据告诉你每季《歌手》之“最”


    五季《歌手》里面,一共有66位歌手(或组合)参加了比赛。网络上有人总结了《歌手》前四季每季的特色:“过气回炉”第一季,“年轻选秀”第二季,“老年春晚”第三季,“港台唱跳”第四季。作为一名专业的数据分析师,我要用数据告诉大家每季《歌手》最具特色的地方真正在哪。

    第一季:资历最老

    每季歌手平均资历

    第一季歌手的平均资历将近20年!远远超出其他季度的歌手!回锅二度的老腊肉林志炫老师的资历才排第五(22年)!前面四位烟熏腊肉分别是:黄贯中(27年)、黄绮珊(27年)、辛晓琪(27年)和齐秦(32年)。

    这也难怪,韩国的《歌手》播出后,唱活了多少沉寂已久的歌坛老将。芒果台这点学得很好,让像黄妈这样的好声音可以被更多人听到。

    第二季:实力最悬殊

    每季常规赛歌手夺冠次数

    根据每位歌手拿第一的次数,我发现第二季常规赛的冠军经常在两位歌手间徘徊,也是《歌手》五季历史上唯二的两位在常规赛中拿过4次第一的歌手!真爱粉想必已经想到他们的名字了。没错,就是霸气外露的韩磊和霸气侧漏的邓紫棋。

    没想到你是这样的磊叔

    第三季:“进口”最多

    看过《歌手》的都知道,节目吸纳了很多“进口”歌手。本季的“进口小哥哥”迪玛希不知虏获了多少迷妹的心,还有上一季最会卖萌的欧巴黄致列。然而,“进口”歌手最多的其实是第三季,“进口”国家高达三个!他们分别是新加坡的陈洁仪,马来西亚的李佳薇,和韩国大型欧巴郑淳元。



    第四季:香港歌手最耀眼

    虽然第四、第五季都有三位香港歌手参赛,但在第四季比赛中,有三位香港选手打进了决赛,并且李玟还夺得了最后的冠军,而第五季只有忆莲姐进入决赛。别忘了,第四季中还出现了那个用极具魅力的港普hold住了全场的主持人。

        请跟我说“无污染,无添加,金典有机——lai”

    第五季:综合实力最强

    为何说本季《歌手》实力最强,分析了一下:1,首发实力强劲。“中亚歌王”迪玛希,“行走CD”林忆莲,“音乐教母”杜丽莎,“东方布莱曼”谭晶,“金曲歌王”萧敬腾(狮子合唱团)。2,逆战歌手也很厉害。其中林志炫和李健都在往季比赛中拿过亚军。逆战歌手的加入让原本强大的首发阵容如虎添翼!

    本季首发歌手阵容




    用数据来看最具冠军相的歌手




    前面分析了很多,好像跟预测没什么关系?别着急,现在我们来看看什么歌手最具有“冠军相”(不是看脸,是看数据)。

    首先,来看看冠军们的五个特征。

    1、冠军一定是首发歌手!

    2、冠军极有可能是大陆歌手。

    3、冠军极有可能是个人而非组合。

    4、冠军的世界里,男女平等。

    5、至少要有十五年的资历,才能拿冠军。

    单看冠军的数据有点片面,我们来观察一下前三名的数据,看看有什么新发现:

    1、首发与补位平分秋色!

    2、“我的地盘听我的”(只要前三有大陆歌手,那冠军一定是大陆歌手;外国歌手再厉害最多只能排到第三,如茜拉、郑淳元和黄致列)

    3、“人多力量未必大”(前三歌手几乎清一色是个人)

    4、“妇女能顶三分一边天”(前三歌手男女比例是2:1)

    5、“不可叫人小看你年轻”(资历10年以下的歌手有三位:杨宗纬、邓紫棋和黄致列。)

    6、“来得早不如来得巧”(杨宗纬常规赛只唱了三场,就捡了个第三)

    7、“优秀是一种习惯”(冠军们在常规赛中拿第一的次数也是最多的)




    谁将跻身前三,谁能问鼎歌王?




    锵锵锵,终于来到激动人心的预测环节。

    通过对比线性回归、决策树和随机森林等众多算法对于前四届歌手决赛排名的预测结果与实际排名的吻合度,我发现随机森林的预测准确率是最高的

    我们还发现:当采用分层模型训练预测时,准确率大大提高!即将前三名歌手当做上层、第四至八名歌手当做下层,分别训练预测。技术细节详见:歌手预测技术篇)

    我们得出了本届歌手的决赛排名:

    (注:图中的数字代表歌手的预测排名,可是为什么是小数呢?因为随机森林是构造很多个决策树进行预测,再对所有预测结果取平均值。)


    这里对预测结果排名前三的歌手做个小小的点评:



    第一名:林忆莲

    1、 她是首发歌手。

    2、她虽是香港歌手,但比较像上一季的李玟,国语也说得很溜。

    3、 她资历是34年,超过历届所有冠军。


          第二名:李健

    1、 前三总会有一名补位(or逆战)歌手,李健就是。

    2、前三没有一位大陆歌手多尴尬啊,李健是内地实力担当。

    3、优秀是一种习惯。李健平均排名2.8,与林、迪并列第一。

    第三名:迪玛希

    1、 外国选手再厉害,最多排第三。迪玛希极可能重蹈大小欧巴的覆辙。

    2、 没有第二了。




    最后祝大家总决赛观战愉快,欢迎在下方投出你心目中的歌王人选。最重要的是动起拇指来转发支持你家歌手吧~




    本文作者:唔好动,以代码为生的填词人,南中国听歌最多”的数据分析师,现就职于广州帷策智能科技有限公司,致力于大数据研究及应用项目。