导航菜单
首页 >  科目一考试宝典在线题库  > Python网络爬取科目一题库(1685道)2021.1.3

Python网络爬取科目一题库(1685道)2021.1.3

Python爬虫获取科目一题库2021.1.31、选取目标网站2、部署实验环境3、网站数据分析3.1 题目分析3.1.1 判断题3.1.2 选择题 3.2 试题图片获取3.3 试题码获取4、实验爬虫测试4.1 爬取前100道题并打印到控制台的Python代码4.2 爬取1685道题并写到word文档的Python代码4.3 爬取题目解析的Python代码

1、选取目标网站

驾驶员考试网址1 在这里插入图片描述 驾驶员考试网址2 在这里插入图片描述         总的来说,科目一顺序练习题总共有1685道题,然而在页面中我们只能点击向右的箭头一道一道来做,但更希望将所有的题整理到一起,放到word文档中。 通过分析发现上述两个网站本身都是驾驶员考试网下的分支,所以题库是完全一样的,下面就以驾驶员考试网址1来进行爬取。

2、部署实验环境

        1、如果安装了Conda的话,可以利用Anaconda新建名称为myenv的虚拟环境,环境中我用的是Python3.6,之后pip方式可以安装依赖包,Python编辑器用的是PyCharm; 在这里插入图片描述 在这里插入图片描述         2、当然,如果没用Conda的话,安装Python3.6也是完全可以的。 在这里插入图片描述         3、pip安装的依赖包包括:requests 2.25.0、urllib3 1.26.2、docx 0.2.4、python-docx 0.8.10、lxml 4.6.2

3、网站数据分析

        在进行Python爬虫之前,我们需要首先确定网页请求

相关推荐: