“简繁通搜”:“在软件层面实现”与“在数据层面实现”的差异。

先生总结得极是。
我们下载mdx,绝大多数情况下,是为了直接查询使用,而非为了逐个拆解,技术分析XML原始数据。
还是回到主帖讨论的问题吧。

“在软件层面实现”的【简繁通搜】,词典本身——无论是正文或者词头索引——绝不呈现任何人为的、机械添加的、主动产生的简繁转换错误内容。用户在【搜索关键字文本框】内输入错误词头“干坤”,词典自动跳转至正确释义“乾坤”,在这整个过程当中,mdx词典本身并不显示任何错误。“干坤→乾坤”的内部跳转,对于用户而言是完全透明的,用户看不到任何错字、错词。

而在数据层面实现的【简繁通搜】,则可能会呈现出大量错误词头给用户。
比方说,用户在【搜索关键字文本框】内输入“干”,下边的【简繁通搜】列表可能会列出一大堆的错误词头,与正确的词头混杂在一起,无任何明显标志(比如,小两号字、斜体、红字或标一粒小星之类)可一眼区分,这其实对于“眼尖”或“强迫症”的用户,是一种残酷折磨,可能会引发灵魂拷问——
“怎么回事?怎么会有【干造】、【干竺】、【干清宫】、……我要不要点进去,赶紧严肃地确认一下:究竟我的语文是体育老师教的,还是音乐老师教的?”
情形大致相当于,你从新华书店的专业书架抽出一本厚词典,查目录发现了一大堆错字,赶紧翻到正文,发现正文却无误……然后惊见粗黑体《编者的话》,大言不惭宣告:

目录错误,这是已知的一个微小问题,根本就算不得什么见不得人的错误,官方确认:这绝对不能算是毁词典!