据我所知爬这个阵亡了很多账号了,都是付费的。
这跟爬【聚典】差不多了。大工程。
之前这个网站我一直无法搜索,一搜索就要求登录,今天竟然可以免登陆搜三个词,估计是3词/ip天,按汉大36w计算,估计要12w/ip天
也就是我们这些老网民才搞这些搜索,破解,汉化的事,现在00后哪有这些情怀,
以前都是楼主好人一生平安,留图不留种,**被人捅
现在都是“这是什么游戏?在哪下载?手机能玩吗?”
你这一说,我有想起,当初百度搜mp3下载听歌美滋滋,现在都是会员制,
到时候词典也一样,用户没有所有权,只有使用权,会员一停,记录归零,整体上维护了歌曲的著作权和版权,长久来看,打击了华语乐坛,听歌要钱,就听抖音的口水歌就行了,听整首要钱,那就听高潮30秒,一首歌每年火一段,年年都有“新歌”听,
到时候词典行业估计也这样,要钱要会员,干脆直接deepseek,管他AI幻觉还是“首当其冲”“七月流火”“一骑 qí红尘妃子笑”
歪楼了
你所说的付费用户怕大都是仅仅开通7天会员的吧 我直接给包月了。对比下7天会员,开通会稍微繁琐一点,不过同样会有限流问题,查阅量一多页面、词条翻转就慢了许多。庆幸的是没有烦人的数学公式验证,也许跟我只是定向查找词条有关吧
直接手动抓取吧,省得弯弯绕绕的。我已经着手开展了,断断续续觅空整的,二十天一卷,速度还是蛮可观的,最快累计四小时两百页,最慢得八小时,视个人专注度和各部首含有生僻字词密度而定
手动也不行的,不包年抓不了几条。
还行,我是跳着复制粘贴的,不用一条条来
21-7-2025
</
𦰫
“𦰫”之前的分割符不完整,导致这个字检索不到。只能在检索“𦲷”字时一起出现。
【㓻風】
㓻氣旋如塊
据图像,“㓻氣”当作“㓻風”。
【劉】
《爾雅·釋木》:“劉,劉𣏾。”
[校记]“劉𣏾”当作“劉杙”。参看《汉语大字典》“杙”字条。
【刺蜜】
缺亦作及例证。
【剥文】
缺例证。
【創匠】
缺例证。
【剺櫟】
缺例证。
【劈角兒】
少“亦作”:亦作“劈𩭛兒”。缺“劈𩭛兒”例证。
【劇路】
缺例证。
【功用】
1.缺例证。
【劫掎】
缺例证。
【勃騰騰】
一个比较有用的元曲用词。可以补两个重要例证。
【勃屑】
缺例证。缺“参见‘勃窣’”。
【嫫母】
缺“亦作‘𡠜母’”。方正版也没有。得对图像才能发现。方正版只是光盘版的加强版,并不是重新制作的版本。
【嫌好】
缺例证。缺“参见‘嫌好道歉’”。
【勞傷】
缺例证。
【叉蔟】
缺例证。
【反要】
缺例证。
【受禪】
缺:亦作“受䄠”。
【斗心】
当作“鬥心”。订补数据词头错误简体化,误入【斗建】条下方,因此无法检索到。必须将“斗心”改为“鬥心”,将数据移到【鬥心】下方。
“鬥”字下的词,其“亦作”的跳转点了都找不到。
〖鬥寵〗亦作“鬭寵”。
凡是“亦作”没有数据,只是指向主词条,或者点了根本找不到的,都不应该有链接。
像“鬭寵”,应该另作索引,指向〖鬥寵〗。
字节买了《汉语大词典》的版权,拥有《汉语大词典》所有词条,确实可以用来校勘。
不同网站买的聚典功能不一样,目前看到的多是汉大之类的。聚典本身工具书很多的。只不过合作的这些网站没买全库。
28-7-2025
【縁】
[校记]光盘2言:“縁:‘緣’的新字形。同‘緣’。‘緣’的日本用简体汉字。”此说大误。《汉语大词典》用“緣”,不收“縁”。《现汉7》字头为“缘(緣)”。《字统网》:“縁:(異)〖緣〗的異體字,见《異體字字典》。”亦不言为日本简体汉字。此字只是一异体字,无涉新旧字形。兹将解释改为:“同‘縁’。”
【緣】
[校记]光盘2言:“緣:‘縁’的旧字形。”此说大误。“縁”为“緣”之异体字。说见“縁”。兹删去“緣:‘縁’的旧字形”,仅保留“亦作‘縁’。”
【舗(U+8217)】1pū
1.舒展。
2.“舖”的日本用簡體漢字
舗(U+8217)2pù
量词。十里为一铺。
【舖(U+8216)】1pū同“鋪1”。
舖2pù同“鋪2”。
对照图像后,我认为必须改成:
【舖(U+8216)】1pū
1.舒展。
舖(U+8216)2pù
量词。十里为一铺。
【舗(U+8217)】
pū 同“鋪”。“舖”的日本用簡體漢字
《字统网》:舗(U+8217):(J0)同〖舖〗。
【舖(U+8216)】原缺例证,可据方正版补。方正版的字头用字没错。
这不是《汉语大词典》的问题,《汉语大词典》没收“舗(U+8217)”。
〖𩿲〗〖𩿲鴄〗
据图像版,“𩿲”皆当作“𩿣”。
【鬥争鬥合】
亦作“鬭爭鬥合”。
据图像,当作:亦作“鬭爭鬭合”。
【鬥色争妍】
亦作“鬭色爭妍”。
据图像,当作:亦作“鬭爭争合”。
【鬥艷争芳】
亦作“鬭艷爭芳”。
据图像,当作:亦作“鬭艷争芳”。
【鬥艷争輝】
亦作“鬪艷爭輝”。
据图像,当作:亦作“鬪艷争輝”。
【鬥麗争妍】
亦作“鬭麗爭妍”。
据图像,当作:亦作“鬭麗争妍”。
【鬥鬩】
缺两个“亦作”和四个例证。
【哮㘚】
注音错了,掉了:(—hǎn)亦作“哮㘚”。
“哮㘚”的李白集例证也掉了。这是一个重要而稀缺的例证。
【巧語花言】
缺最早例证。
【差參】
缺例证。
【土彊】
缺例证。
【彊4彊】
掉了(—jiāng)。自动注音误。
【媇】
图像版没这个字,文字版却加了两种页码。这种图像版没有的字,页码都应该删去。
〖𤚼〗06-0288
〖𤛓〗06-0286
文字版此二字的页码必须对调。
【䳮】
页码应为DCD121135。目前页码实际指向“𩥔”。
【䐠(U+4420)】
须将“䐠(U+4420)”一概替换为“㬻(U+3B3B)”。“䐠(U+4420)”另加索引,指向“䐠(U+4420)”。方正版用字也不对。旧词典从肉的字,《汉语大词典》都改收入月部,所以应该改用月字旁的字。
〖啢〗[liǎnɡ] [yīnɡliǎn]
〖唡〗[liǎnɡ] [yīnɡliǎn]
“liǎn”皆当作“liǎng”。
【鐘】
[校记]光盘2言:“‘鈡’的繁体字”,误。兹改为“亦作‘鈡’”。
【鈡】
[校记]光盘2言:“‘鐘’的简化字”,误。兹改为“同‘鐘’”。《字统网》:(異)「鍾」的異體字,见《異體字字典》。
【塊】
亦作“圦”。
[校记]误。应改为:亦作“𡉇”。
电子版是有“圦”,但是图像版用的是“𡉇”。
【𡈼(U+2123C)】
同“壬(U+58EC)”。
按:《汉语大词典》没收【𡈼(U+2123C)】。说【𡈼(U+2123C)】同“壬(U+58EC)”的根据是什么?
这是一个完全不同的字。大家可以自己细读《汉语大字典》。
《字统网》:Man (人) + Earth (*一) → Man standing on earth with good mood → Stand upright. Initial form of 挺.。
数据来历不明,整条删除。
1-8-2025
【策】
亦作“笧”
[校记]应改为:亦作“𥬰”
【戱(U+6231)】
[校记]应说明此为“戱(U+6231)”的旧字形。
【逺】
[yuàn]
义未详。
[校记]《字统网》:“(異)〖穨〗的異體字,见《異體字字典》。yuan4。(11)离去;避开。(12)不接近,不亲近。(13)违背,乖离。”
何以言“义未详”?《汉语大词典》〖遠〗下清楚说明了[yuàn]音的释义。
【潀】
同“潈”。
[校记]图像版:同“潨”。
【乁】
现代汉字笔形之一,称“捺”。
[校记]《汉语大字典》“乁”为另一字,对应于“捺”的字用“㇏”。此电子版又有一字头用“乀”。
《汉语大词典》图像版对应于“捺”的字用“乁(U+4E41)”,电子版又另出一字头用“乀(U+4E40)”。《汉语大字典》“乁(U+4E41)”为另一字,对应于“捺”的字用“㇏(U+31CF)”。
【蝆】
义未详。
[校记]《字统网》:“(異)〖䖹〗的異體字,见《異體字字典》。”
《汉语大词典》收的是“䖹”。
𡰧(U+21C27)=010770
𡰴(U+21C34)=040010
[校记]040010的仍然是𡰧(U+21C27),此字二出。电子版将040010的“𡰧”字头误作“𡰴(U+21C34)”。
1.〖𢴱〗[cāo]
同“操”。
2.〖撡〗[cāo]
同“操1”。
此二条内容全同,指向同一页码,前者(〖𢴱〗条)为字头错误重出,全条须删去。
【鰺1】
[校记]光盘版言:“鱼名。”兹据图像改为“同‘䱗’”。
【录】
錄的简化字。
当作:録的简化字。
【睁察】
亦作睜叉。
当作:亦作睁叉。
【𧢡】
【矀】
此二条词头当互易。
图像版有【矀】:覹=100356,电子版收入数据,却用了错误的字头【𧢡】。
又说【𧢡】同【矀】,根本没有根据。《汉语大词典》、《汉语大字典》都没这样说。电子版却断言如此。字统网、叶典都没采用。hdc mdx还是这样说。
【镟1】xuàn
鏇1的简化字。
【镟2】xuán
鏇2的简化字。
[校记]“鏇”不分1、2,只有xuàn一个音。其词头为“鏇[旋]”。未说明“镟”是简体字。
《汉语大字典》才有xuàn、xuán两个音。
【𨬕】
【金僕𨬟】
据图像,“𨬟”皆当作“𨬟”。
【灦】
见“灦煥”。
当作:见“灦焕”。
【烉】
同煥。
当作:同焕。
【焕然一新】
本作“煥然如新”。
当作:本作“焕然如新”。
【巍奂】
亦作巍煥。
煥 -->焕
【月落參横】
亦作“月沒參橫”。
当作:亦作“月没參横”。
【横征暴歛】
同“橫2徵暴賦”。
当作:同“横2徵暴賦”。
【横從】【横斂】
【横徵暴斂】【横征苛斂】【横眉瞪目】【横禍飛災】【横科暴斂】【横草不動,竪草不拿】【横草不拏,豎草不拈】【横説竪説】【横2賦暴斂】【汙口横衊】【豺狼當道】〖飛殃走禍〗
情况相同。“亦作”都误用旧体字“橫”。
【横草不拈,豎草不動】
几个类似的词条被光盘版合并了,错乱得厉害。《复刻》已经还原。想了解原貌的可以看《复刻》。
【聮】
[校记]光盘版言:“义未详。”兹改为:“同‘聯’”。《汉语大字典》:“聮:同‘䏈(聯)’。”
【簆】
解释文本大概是从光盘3复制过来的,全为繁体字,可从《复刻》把简体的解释复制过来。
缺例证,方正版也缺,可以ocr图像补上。
【橶】
橶,间戟
据图像,当作“𣛔”。“橶,间戟”当作:“𣛔音戟”。
〖偽〗4[wéi]
义未详。
按:《汉语大字典》:“偽:(二)wéi:同‘為’。”
〖襔〗[mǎn]
义未详。
按:《字统网》:(方)吳语,宽,蘇州,mø˥。除單長衫以外的長袍子都稱襔。(蘇州)。(汉字海)jian3,丝绵棉袄。
【閁】
閁 chènɡ
撑。
[校记]《汉语大词典》无此字。“chènɡ、撑”音义对应的字是“𫔘”,“𫔘”字见《汉语大词典》第12卷0020页。《汉语大字典》:“閁[mà]:邪视。”
因sxingbai兄提起,才注意到:
【山東出相,山西出將】
【山東山相,山西出將】
这两条内容相容,后一条词头错误。
这个图像版有注音:(相xiàng,將jiàng)。mdx自动注音错了。