吾与点古籍自动整理系统

吾与点古籍自动整理系统

所属分类:古籍网

官方网址:http://wyd.kvlab.org

-- -- 0

站点介绍

“吾与点古籍自动整理平台”是由北京大学数字人文研究中心与中文在线集团元引公司联合开发的智能化古籍整理平台。该平台提供图片文字识别、自动句读、命名实体识别等基本古籍整理功能,目前自动句读标点功能已开放测试,图片文字识别、命名实体识别功能将于近期开放测试,敬请期待。
“吾与点”自动句读模型是基于预训练语言模型BERT实现的,利用开放古籍语料"殆知阁"(daizhige.org)和公开的古典诗词文集训练得到。目前,断句模型在古文语料上的准确率达到94.90%,在古典诗文和词文的准确率分别达到99.39%和97.61%。

相关推荐

  • 避讳字知识库

    避讳字知识库

    上海图书馆开放数据平台发布的《避讳字知识库》检索。现有数据701条。

  • 中华大字典

    中华大字典

    中华书局籍合网在线小工具:字典。数据来源:《中华大字典》。

  • 嘉业堂藏书志

    嘉业堂藏书志

    《嘉业堂藏书志》由近代学者缪荃孙、吴昌绶、董康等赓续修撰成书。计著录嘉业堂藏书盛期所庋善本古籍一千七百馀种,各书均记其书名、卷数、著者、版本及藏印等,或录原书序...

  • 北大古汉语语料库

    北大古汉语语料库

    詹卫东、郭锐、谌贻荣,2003,北京大学中国语言学研究中心CCL语料库(规模:7亿字;时间:公元前11世纪-当代)。主要功能特色:支持复杂检索表达式(比如不相邻...

  • 台湾报纸数据库

    台湾报纸数据库

    查询台湾地区馆藏中西文报纸。【备注】该站已改为馆内浏览。

  • 关西大学汉籍

    关西大学汉籍

    日本关西大学所藏汉籍

微信二维码