导航菜单
首页 >  花火学院考试  > Say花火论坛抓题脚本

Say花火论坛抓题脚本

2021.1.12 更新:

Say花火重新启用了注册答题机制,题目没有大的变化但依然有CloudFlare墙,因此该脚本已不能自动爬取题目,但仍然可以手动保存题目然后解析为易于查看的格式.

统计后共有380道题目,可以说是十分丧心病狂了

这个脚本还有不完善的的地方,不过也够用了.

import requests

import os

import sys

import json

from requests.cookies import RequestsCookieJar

URL = "https://www.say-huahuo.com/qa.php"

Session = requests.session()

Html = Session.get(URL)

ExplainText = Html.text.encode('utf-8').decode('unicode_escape')  # 把Unicode代码转为中文

ExplainTextDic = json.loads(ExplainText)  # 将JSON转为字典

FileHandle = open("Question.json", 'a+', encoding='utf-8')  # 以追加模式打开文件

i = 0

while i

相关推荐: