导航菜单
首页 >  数据采集期末考试  > 爬虫试卷

爬虫试卷

姓名:_________        分数:_________        总分:100分

 

一、填空题

1. list1 = [x for x in range(5, 2, -1)],则打印list1的结果是_____[5, 4, 3]______。(2分)

2. Python中的编码格式你用过哪些?___GBK_____,___ASCII_____,____Unicode(utf8)____。(2分)

3. 数据库大致分为_____关系型数据库______,______非关系型数据库______类型,列举你学过的数据库名称___MySQL____,____Redis____,____Mongodb____,_____sqlite____。(4分)

4. 字典和列表的区别有哪些?(2分)

i)字典通过键建立与值得关系,列表通过索引建立和值得关系。ii)字典存储得数据不是按照数据添加得先后顺序存储的,而列表是按照数据添加得先后顺序保存得。iii)字典通过键取值,不支持切片查询;列表通过索引取值,支持切片查询。

5. Scrapy创建项目、创建爬虫、运行爬虫的命令分别为(3分)

scrapy startproject spiderscrapy genspider zhihu zhihu.comscrapy crawl zhihu

6. 列举常用的数据解析方式及解析用到的包(2分)

Xpath、css、bs4、lxml

7. 写一个匿名函数,用于计算两个数的和 

lambda x,y: x+y。

二、简答题

1. 通过代码创建一个.xls的文件到本地,并写入多条数据,比如姓名,年龄,身高,体重等。(3分)

import xlwtbook = xlwt.Workbook()sheet = book.add_sheet('stu')sheet.write(0, 0, '姓名')sheet.write(0, 1, '年龄')sheet.write(0, 2, '身高')sheet.write(0, 3, '体重')list1 = [('zhangsan','20','180','80'), ('lisi','30','170','60')]row = 1for name, age, height, weight in list1:sheet.write(row, 0, name)sheet.write(row, 1, age)sheet.write(row, 2, height)sheet.write(row, 3, weight)row += 1book.save('stu.xls')

2. 类中的关键字self和super的区别是什么?(2分)  

self在类中表示当前类得对象。Super在类中表示当前类。

 

3. requests模块如何实现cookie的自动化管理,通过代码将主要逻辑实现出来。(3分)

相关推荐: