导航菜单
首页 >  数据分析及辅助工具  > 第2章:R语言中的数据管理与预处理

第2章:R语言中的数据管理与预处理

案例引入

电影是大众喜闻乐见的一种艺术形式。如今,电影市场中百花齐放,喜剧片、动作片、科幻片、动画片等电影类型争奇斗艳,各类元素文化在电影中都得以展现。

随着我国人民生活水平的提高,电影也成为不少家庭娱乐项目中的一个重要组成部分。从2008年的票房冠军《赤壁上》(2.7亿票房),再到2019年的票房冠军《哪吒之魔童降世》(49.3亿票房),中国电影票房一直保持快速增长态势。据《全球电影产业发展报告(2019)》统计数据显示,中国电影产业于2018年发展为全球第二。中国电影市场蓬勃发展的同时,也因为前景光明,利润巨大,从而导致行业规范模糊,从业人员鱼龙混杂,以至于烂片层出不穷,受观众诟病。电影品质良莠不齐,有的电影在时间的长河中历久弥新,有的电影却消失得无声无息。高评分电影反映了观众对于不同题材的喜好,针对高评分电影进行统计分析可以为日后电影拍摄提供有效支持。

本章节采用的是某电影榜单上排名top250的电影数据,数据集包含250部电影的名称、评分等数据。数据的变量说明表如下所示:

变量类型变量名详细说明取值范围属性score电影评分[8.3,9.6]type影片类型爱情、动作、动画等duration电影时长(分钟)[84,131]rank电影排名[1,250]nation制片国家/地区中国,美国,英国等档期showtime电影上映时期[1931/1/30,2017/11/24]Year电影上映年份[1931,2017]导演基本信息director导演名字导演名字rm(list = ls())#清空环境movie

相关推荐: