📚 字库说明

镜原甲骨文字库,为笔者在过去三年间使用人工描摹和计算机辅助相结合的描绘方式制作而成的超清甲骨文全字库,收录了超过 5 万个甲骨字形,包括 3,700+ 个字头、5,500+ 个子字头,字形清晰度均在 2048*2048 像素以上。

本字库的设计上采用三层子级结构,分别为字头子字头异体字

  • 字头: 某些工具书也称为“字号”,为甲骨文的基础单位。一类构形、用法或释义都相同或相近的字形,可以视为同一字头,亦即一个甲骨文字。
  • 子字头: 为字头的子级,用于区分字头下的不同写法。当一种字形相对一个标准字头写法发生特质性的外形质变,从而导致异体字或异体字组的产生,即可视为不同的子类形体。对于复合字形而言,不同的部件组合、相异的空间位置关系都可以导致写法或外观上极大的差别,如“疾”字写法可以有“󺙕”、“󿳌”、“󿳊”、“󳺢”、“󺛎”等多种。而对于独体字而言,这可能表现为笔画的有无、写法上的省检,如“马”字可以有“󲈽”、“󲊐”、“󲊖”等写法。子字头的设立,有助于更好地区分形体不同、但用法和释义相同的字形组,这样一方面可使相关字库或释文库的检索更加精确,另一方面也可以适应由于考释成果不断进步,字头分类不断细化或统合的需要。
  • 异体字: 为子字头的子级单位,本字库中所收录的异体字均为来自真实甲骨著录的字形用例。异体字的存在才使得子字头或字头的设立成为可能。甲骨文中普遍存在一个字头下只有一个用例的情况,直接在字头/子字头下收录真实字形用例,有利于子字头级别上随时的分合,可以很好地适应因异体字误摹、漏收、重收导致字头上的设立问题。

这三种层级结构的区分,在字库检索页面下有很好的体现,用户可选择不同的显示模式查看同一字头下所统辖的子字头和异体字,或者进入字头的页面查看详细信息。

在码点的选择上,本字库采用了多码点分配的方式,即一个甲骨字形可能会有多个不同码点相对应,而输入任何一个码点、选择字体后都可以转换为相同的样式。比如“󾄁”(祼)对应了U+FE101U+BB59BU+797C三个 unicode 标准码,其中U+FE101为字库独有字码,来自于 PUA-A(unicode 私用区),而U+BB59B为引得市所分配之隶定字码“򻖛”, 而U+797C则为“祼”之字码。这样设计的原因是为了方便 word 文档中的即时转换,而不需要为每个字码查阅本站的字库检索页面。但整体来说,只有已有隶定字对应的字形才会出现多码点的情况,字库中绝大部分字码仍为一对一的字码设计。

🌱 字库来源

当前本字库中绝大部分字形来源于李宗焜先生 2012 年出版的《甲骨文字编》一书,原书共收录了 46,635 个甲骨字形。本字库除少数外观上极为相似的字形,基本全部予以收录和高清重绘,而字库中字头及子字头的部分(~5700 个),一小部分来自于《甲骨文字诂林》字头的样式,其他则为基于异体字组的特征、并结合笔者自己对于甲骨构形的认知而制作的完全原创字形(《诂林》的部分由于字形相对不够美观,未来也会逐步被新样式所覆盖)。此外,字库还收录了一批出自其他来源的甲骨字形,如来自于《新甲骨文编(增订本)》和一些新出著录如俄藏、拾遗、村中南、周原的甲骨字形。后者集中用于补充《甲骨文字编》中未收录的字头部分,如村中南 71 所见“󳒩”、周原 H90:79 所见“󿰱”等。而特殊异体字的补充和收录,后续也会逐步进行。尤其《新甲骨文编》所收,而《甲骨文字编》未收的异体字,将着重加以收录,为当前 版本 v1.1的主要任务,具体字库的建设进度可参考待收字形表

📜 更新记录

以上谈到,本字库的制作很大程度上建立在李宗焜先生《甲骨文字编》的字样基础上,那么原有字编中的错误,本字库中也会不可避免地继承下来。不过,本字库的制作过程中,已经对近十年来的甲骨文研究考释成果进行尽可能的吸收,并尽笔者个人最大的努力,对原有字编中的一些错误和不足进行了修正和补充。

故而本文档以下内容主要记录镜原甲骨字库基于李宗焜先生 2012 年出版的《甲骨文字编》一书所进行的各项修改,所做所有修改超过 3000 余条,主要包括以下几项:1. 文字于字号层面的合并、删除、增补及重归类; 2. 异体字正确字号归属的修正; 3. 单个字形误摹的修正;4. 字形于书中重收例的注明及修正; 5. 字形著录来源及片号的修正; 5. 文字习刻、伪刻、倒刻、侧书的标明等。6. 文字隶定错误的修正。

目前,由于笔者论文写作的需要,新做出的修正和补充未在此做详细记录,但在字库中已经得到了体现。而在本版本文档中,主要会记录之前参考文献和论文中已提出过的修改意见,和其他一些较明显的错误。而凡字库中修改条目有参考前人专著及论文者,均于每条末尾以芝加哥行内标注的方式注明(参考书目见文档末尾)。

版本 v1.0.2 (预计发布时间:2025 年 1 月 1 日)

  • 主要任务:
    • 完成剩余 1/3 的甲骨部件编码
    • 修订字形错误
    • 增加部分异体字收录
    • 增加专名标注

版本 v1.0.1 (发布时间:2024 年 10 月 5 日)

综合:

  • 更正了某些字号归并上的错误
  • 修正了部分字头的显示样式
  • 增补少量字形
  • 完成了 2/3 字头、子字头的部件编码方案,并优化 SQL 查询代码,网站当前可支持较广泛的部件检索功能(包括检索和释文输入工具)
  • 完成了 193 个田猎地名的标注(仅字头级别,其所统辖部分字形用例非用为地名者,使用时需加以区分)。参考资料:宋镇豪主编《商代史·卷一》,中国社会科学出版社,页 240-248。
  • 完成了部分祭名的标注。

新设字号:

  • 新设字号𦣢,见于山东博 8.33.19󿵬,从“𦣞”、“巿”,隶定为“𦣢” (Song 2020, 44)
  • 新设字号󿵭,见于山东博 8.33.21󿵮,从“良”、从“戈”,隶定为“󿵴” (Song 2020, 44)
  • 新设字号󿵱,见于山东博 8.35.14󿵲,从“鹵”、从“干”,隶定为“󿵺”
  • 新设字号,见于台历博 1274(《运台》摹 1.1355)󿶕,从“女”、从“覃”,隶定为“㜤”

版本 v.1.0.0 (发布时间:2024 年 7 月 4 日)

参考书目:

  • 蔡哲茂:<《甲骨文合集》辩伪举例>,《汉字研究》第 24 卷第 1 期,2006 年,页 417-441。
  • 蔡哲茂:<《甲骨文字编》指瑕>,《甲骨文与殷商史》第五辑,页 233-282。
  • 陈剑:<释“”>,《出土文献与古文字研究》第三辑,上海:上海古籍出版社,2010 年,页 26-28。
  • 蒋玉斌:<释甲骨文中的“独”字初文>,《古文字研究》第三十辑,北京:中华书局,2014 年,页 67-72。
  • 李学勤:<《夏小正》新证>,《古文献丛论》,上海:上海远东出版社,1996 年。
  • 乔雁群:<《甲骨文字编》较读札记 37 则>,《甲骨文与殷商史》新九辑,2019 年。
  • 裘锡圭:《裘锡圭学术文集-甲骨文卷》,上海:复旦大学出版社,2012 年。
  • 宋镇豪:<关于山东博物馆、天津博物馆所藏甲骨文的整理研究>,《甲骨文与殷商史》第十辑,2020 年,38-57。
  • 王子杨:《甲骨文字形类组差异现象研究》,上海:中西书局,2013 年。
  • 王子杨:<释黄组卜辞特殊写法的“黍”字>,《汉语言文学研究》2021 年第 2 期,页 128-130。
  • 吴丽琬:<《甲骨文字编》较补>,首都师范大学,博士论文,2017 年。
  • 谢明文:<说临>,《出土文献与古文字研究》第六辑,上海:上海古籍出版社,2015 年,页 97-104。
  • 徐雅:<近出三种甲骨文字形表互较勘订>,浙江师范大学,硕士论文,2017 年。
  • 赵爱学:<《甲骨文合集》《补编》等所著录国图藏甲骨校勘记之一>,《文献》第 1 期,2020 年,页 156-192。
  • 赵爱学:<《甲骨文字编》校订 230 则>,《语言历史论丛》第十六辑,2021 年。
  • 周忠兵:<释甲骨文中的“焦”>,《文史》第 3 辑,2014 年,页 255-262。
  • 周忠兵:<释甲骨文中的“򥶱”>,《古文字研究》第 30 辑,2014 年,页 60-66。