抓取词典数据的问题

可以改成3秒试试,谨慎点比较好,被屏蔽IP了就惨了。

都可以,可以先抓取网页,保存成001.html,再抓取json保存成001.json,所有词条抓取完后再来处理jinja2。

jinja2的处理流程是,先创建jinja2模板,再用python内置的json模块读取001.json,用json填充jinja2模板,生成例句的html字符串后,读取001.html文本,直接用前面生成的字符串替换001.html的空白例句位置的文本,然后保存001.html文件。

上面只是简单描述,很多细节还要找下文章教程参考,jinja2+json的教程可以参考下这里: