大英百科全书202412(网络版) 主站数据 www.britannica.com/

Oxford Dictionary of National Biography词头都没处理,查询起来费劲

谢谢,看来没有那么简单。

不过用redirect,还得去撞网站无数次,还不如重新下载一次数据,保留地址。

我准备有空添加first name+last name,还有分开 (lastname,firstname)还有单独 last name, 单独fistname的

目前先折腾Kids 和 ONDB的发音/视频。

2 个赞

音频 地址 还没有 搞定吗

在搞OED, 音频没啥动力。你的academic里面的URL有没有

给你的 就是 元数据啊

先把 这个 地址 能出来吧 我要用 等我学会了 就行了

ONDB的发音/视频

数据里面是文件,但是如何区分scholar, kids, compton etc

这个很小众,先弄OED

1 个赞

简单 kids 里面 重新 抓一边数据就行 自动分为3部分

你是不是把三个混在一起了。等于丢失了关键信息。

biography有啥学习的,就是普通语句。

这个是个 小玩意 下面给你一个 大的

https://baike.baidu.com/view/1

这又不是啥常用的。

那 先把 音频的地址 发给我呗 我研究下

没有发现规则,没批量处理。已经发给你一个了,你无回复。

quick facts 里的 see all contents 跳转到的 facts 网页没有爬,而且你的mdx里把链接给删了。

没有靶向,留着干啥?



这些iframe内嵌网页都被删掉了。

源网站不是有指向的网页吗