#
基于外网权威动漫网站myanimelist.netAPI提供数据,对年以来网站的布动漫作品,利用python进行数据分析,以“推荐动漫”为目进行报告。#动漫推荐#
数据概述Overview
提供的csv数据文件是矩阵(,6),即六个纵列(参数)和部动漫。动漫参数分别为:
name(名称)non-nullobjectgenre(题材)non-nullobjecttype(类型)non-nullobjectepisodes(集数)non-nullobjectrating(分数)non-nullfloat64members(人数)non-nullint64
其中type(类型)分为TV,电影,音乐剧,OVA,ONA,特典六个部分。对空白值进行简单的填充后,对每一个类型的动漫进行了占比的可视化:
其中,OVA是OriginalVideoAnimation(原创光盘动画),ONA是OriginalNetAnime(原创网络动画,靠网络传播的免费动画)。TV版,OVA和动漫电影是数据来源的主要对象。
Rating是用户给动漫的分数,满分为10分。拿动漫类型和分数进行分析可以得到数据的箱型图:
所有类型中,电影版的分数相对分散,可能受到电影质量,市场,题材等影响,观众对于动漫电影的感受褒贬不一。TV版动漫更容易获得高的分数,而音乐剧和ONA并不容易获得高分。同时,利用平均数也能大致看出整体打分趋势:
我们依然可以利用动漫的题材种类Genre进行统计。动漫被网站分类为很多类:动作(Action),冒险(Adventure),喜剧(Comedy)等,且每一部动漫都会被贴上多个标签。将标签拆分之后重新统计,取Top20最多题材的标签进行可视化:
最火的题材为喜剧Comedy,也许是因为喜剧大多成本低,但能获得较高的分数,受欢迎而收益多。其次是动作Action,冒险Advanture,幻想Fantasy和科幻Sci-Fi,比较受到制作方和观众的欢迎。
推荐动漫Re
转载请注明:http://www.0431gb208.com/sjszjzl/7895.html