20240311 牛津短语动词词典(英汉双解第二版) 从数据库提取 变体之类

感谢草兄!测试了一些单词,个人有些建议您看从整理数据的角度上是否合适。

参考词典源数据的原有词头补充抓取和调整(猜测应该可能有对应标签/跳转数据?),一来批量转换更有效率,二来避免漏抓:

以下例子在app中均有词头(后附图):

  • irregular form of(tried跳转至try,driest跳转至dry,traveled跳转至travel,taken跳转至take)
  • variant of (USA/U.S.A.均跳转至U.S.)
  • alternative forms of (lots跳转至lot, sales跳转至sale,books跳转至book)
  • plural of (dummies跳转至dummy,tries跳转至try)
  • derivative of (dryness跳转至dry,absently跳转至absent)

不知道源数据是否还有其他类似标签,我手上没有源数据无法穷尽,只能在app里面挑了一些我想到的词头来测试。

对于源数据无词头,但在其他词头下有内容,个人建议无需单独提取词条内容,只要查询该单词时跳转至原有词头即可,举例:book义项5的books,sale义项4/5的sales,建议改成查询books跳转至book,查询sales跳转至sale)

再次感谢草兄无私奉献!












2 个赞