2021.1.12 更新:
Say花火重新启用了注册答题机制,题目没有大的变化但依然有CloudFlare墙,因此该脚本已不能自动爬取题目,但仍然可以手动保存题目然后解析为易于查看的格式.
统计后共有380道题目,可以说是十分丧心病狂了
这个脚本还有不完善的的地方,不过也够用了.
import requests
import os
import sys
import json
from requests.cookies import RequestsCookieJar
URL = "https://www.say-huahuo.com/qa.php"
Session = requests.session()
Html = Session.get(URL)
ExplainText = Html.text.encode('utf-8').decode('unicode_escape') # 把Unicode代码转为中文
ExplainTextDic = json.loads(ExplainText) # 将JSON转为字典
FileHandle = open("Question.json", 'a+', encoding='utf-8') # 以追加模式打开文件
i = 0
while i