抓取词典数据的问题

last_idol · 2023 年12 月 10 日 05:58

可以改成3秒试试，谨慎点比较好，被屏蔽IP了就惨了。

都可以，可以先抓取网页，保存成001.html，再抓取json保存成001.json，所有词条抓取完后再来处理jinja2。

jinja2的处理流程是，先创建jinja2模板，再用python内置的json模块读取001.json，用json填充jinja2模板，生成例句的html字符串后，读取001.html文本，直接用前面生成的字符串替换001.html的空白例句位置的文本，然后保存001.html文件。

上面只是简单描述，很多细节还要找下文章教程参考，jinja2+json的教程可以参考下这里：