实际上并不是一个"<>"就对应html里的一个标签,如下面这个词条:
<1F09><0001><1F41><0160><1FE2><0001>うま・れる【生〔ま〕れる・産〔ま〕れる】<1FE3>うま・れる<1F61><1F0A>
<1F09><0010>【生〔ま〕れる・産〔ま〕れる】<1F0A>
<1F09><0100>(自下一)<B938>レ・レ・レル・レル・レレ・レロ(レヨ)<B939><1F0A>
<1F09><0102><B123><1F04> <1F05>子や卵が母の胎内から出る。また、卵がかえる。<1F0A>
<1F09><0104><1FE0><0000>「<1FE1>弟が―<1FE0><0000>」<1FE1><1F0A>
<1F09><0104><1FE0><0000>「<1FE1>北海道に―<1FE0><0000>」<1FE1><1F0A>
<1F09><0102><B124><1F04> <1F05>[生]物事やある状態が新たにできる。<1F0A>
<1F09><0104><1FE0><0000>「<1FE1>新記録が―<1FE0><0000>」<1FE1><1F0A>
<1F09><0104><1FE0><0000>「<1FE1>疑惑が―<1FE0><0000>」<1FE1><1F0A>
<1F09><0108><B238>う・む(五) <B237>うま・る(下二)<1F0A>
<1F09><0129><B249><1F04><1F05><B24A><caption><1F10>類語<1F11></caption><1F0A>
<1F09><0129><1F04><1F05><tr><td>人</td><td>誕生する・出生する・出来る・生まれ落ちる・呱呱<B647>ここ<B648>の声を上げる・産声<B647>うぶごえ<B648>を上げる・母親の腹を痛める</td></tr><1F0A>
<1F09><0129><1F04><1F05><tr><td>聖人</td><td>生誕する・降誕する</td></tr><1F0A>
<1F09><0129><1F04><1F05><tr><td>哺乳類</td><td>誕生する・出来る</td></tr><1F0A>
<1F09><0129><1F04><1F05><tr><td>卵生のもの</td><td>誕生する・出来る・かえる</td></tr><1F0A>
<1F09><0129><1F04><1F05><tr><td>害となるもの</td><td>発生する・湧<B647>わ<B648>く</td></tr><1F0A>
<1F09><0129><1F04><1F05><tr><td>組織</td><td>誕生する・出来る・結成される・呱呱の声を上げる・産声を上げる</td></tr><1F0A>
<1F09><9999><1FE2><0007>00005987<1FE3><1F0A>
可以看到,每个部分前都是换行并以<1F09>
开始,<1F0A>
结束的,那这两个就可以分别理解成<p>
和</p>
;
另外,从第十一行开始的表格,可以看到<tr>
和<td>
用的还是html的原字。
每行的第二个标签,后面并没有对应的用来闭合的标签,如:
<1F09><0010>【生〔ま〕れる・産〔ま〕れる】<1F0A>
那第二个“标签”就可以理解成“class=0010
”,并且第二个是最重要的,用来标明元素的类型,以下是我整理的一些:
<0001>:标题
<0002>:和歌标题
<0003>:字标题
<0004>:专有名词标题
<0005>:专有名词子标题(不单独成条)
<0006>:子标题(不单独成条)
<0007>:子项目(不单独成条)
<0008>:五十音标题
<0010>:副汉字标题(0010-0016实际都不显示)
<0011>:专有名词副汉字标题
<0012>:专有名词子汉字标题
<0013>:子汉字标题
<0014>:人名汉字子汉字标题
<0015>:普通汉字副汉字标题
<0016>:标◇汉字副汉字标题
<0017>:旧字副汉字标题(显示)
<0022>:汉字音读
<0023>:汉字训读
<0024>:汉字训读(暂时不太清楚两者区别)
<0028>:历史假名
<0100>:释义前内容
<0102>:释义
<0104>:例句
<0107>:反义
<0117>:难读
<0118>:人名音
<0119>:和歌
<0129>:表格
<0108>:其它词类
<9999>:编号
除此之外,还有一些比较明显的特征,比如单独成条的词头(非子项目)开头两个标签后都会接<1F41><0160><1FE2><0001>
,而其它的标签通常是成对闭合的,比如<B647>
和<B648>
代表片假名,<B938>
和<B939>
代表用小字体显示的动词变形等等,<B123>
等对应外字表内的外字。那刚才那个词条的开头就大致可以翻译成这样:
<p class="标题">
<title>うま・れる【生〔ま〕れる・産〔ま〕れる】
<pronun>うま・れる</pronun>
</title>
</p>
<p class="汉">【生〔ま〕れる・産〔ま〕れる】</p>
<p class="释义前">(自下一)
<transform>レ・レ・レル・レル・レレ・レロ(レヨ)</transform>
</p>
<p class="释义">①<space> </space>子や卵が母の胎内から出る。また、卵がかえる。
</p>
诸如此类。
楼主说telegram上有人有一些进展,但我回看聊天记录发现那个人把聊天记录都删了,大概是不愿意分享吧