吾与点古籍自动整理系统

吾与点古籍自动整理系统

所属分类:古籍网

官方网址:http://wyd.kvlab.org

-- -- 0

站点介绍

“吾与点古籍自动整理平台”是由北京大学数字人文研究中心与中文在线集团元引公司联合开发的智能化古籍整理平台。该平台提供图片文字识别、自动句读、命名实体识别等基本古籍整理功能,目前自动句读标点功能已开放测试,图片文字识别、命名实体识别功能将于近期开放测试,敬请期待。
“吾与点”自动句读模型是基于预训练语言模型BERT实现的,利用开放古籍语料"殆知阁"(daizhige.org)和公开的古典诗词文集训练得到。目前,断句模型在古文语料上的准确率达到94.90%,在古典诗文和词文的准确率分别达到99.39%和97.61%。

相关推荐

  • 如是古籍数字化平台

    如是古籍数字化平台

    具备古籍图片OCR文本识别、智能标点、标签迁移、多文本比对等功能。

  • 哈佛燕京中文善本古籍特藏 上图版

    哈佛燕京中文善本古籍特藏 上图版

    哈佛大學哈佛燕京圖書館藏中文善本古籍特藏系統。本系統還有國圖版,請結合利用。

  • 木简库 日本

    木简库 日本

    《木简库》(MOKKAN-KO)是木简的综合检索系统。通过此系统,用户不仅可以检索记载在木简上的文字、文字图像,还可以检索与木简相关的各种信息。我们合并了《木简...

  • 纪年换算

    纪年换算

    中华书局籍合网在线小工具:纪年换算

  • 两千年中西历转换

    两千年中西历转换

    當代的西曆稱為格理哥里(Gregorian)曆,由教皇格理哥里十三世頒行,於1582年10月15日啟用。在此之前的西曆稱為儒略(Julian)曆,規則很簡單,年...

  • 清人文集影像数据库

    清人文集影像数据库

    南京图书馆藏有大量的集部典籍,清人文集占了其中很大的比例,这次选取100部文集进行全文发布。这些文集,从作者生存年代来看,涵盖清初至清末各个时期;从版本上看,主...

微信二维码