哪位大神帮忙把《中文词语搭配》库转换成mdx格式

有点类似于COCA,但是语料库的数据量和质量堪忧。

即使是COCA,有时其搭配看起来也很无厘头,这是它的规则引起的,比如:

the …of

再比如 be … since