古联OCR

古联OCR

所属分类:古籍网

官方网址:http://ocr.ancientbooks.cn

-- -- 0

站点介绍

古联公司基于机器学习技术研发的面向古籍的智能OCR(图像文本识别)系统,主要处理版刻、写本等各式版本类型的古籍图像,具有智能版面分析、智能成分标注及标注结果的输出能力,常规古籍版面,包含双行夹注、眉批、行间批注、表格的特殊版面都能较好处理,提供即时修订文本、下载doc格式文档的功能。
当前版本支持一次上传1页图像,半页、筒子页、上下拼页、上中下页版面皆可,识别结果精准定位单字, 提供三种校对模式:原版图文综合对照的版式校对、行列切分后每行图文罗列的单列校对、单行图文滚动展示的折校,各模式校对结果实时共享。
多页及图书编辑模式正在研发中。

相关推荐

  • 历史文字资料库 台湾

    历史文字资料库 台湾

    歷史文字資料庫統合檢索系統是聯合國内外機構建置的資料庫入口網站,致力於整合各別研究機構及研究者對於東亞及世界各地的木簡及其他文字資料進行的相關研究,尤其著重於推...

  • 通用型古籍数位人文研究平台

    通用型古籍数位人文研究平台

    以台北“國圖”特藏明人文集為文本,將其數位化成果全文轉置後,結合政大社資中心開發之各項數位分析工具,建置出一個既符合人文學者研究需求,又能提供大眾古籍內容分析的...

  • 汉典

    汉典

    汉典是一个面向广泛受众、含有丰富及有益内容的教育和信息网站。汉典始建于2004年,是一个有着巨大容量的字、词、词组、成语及其他中文语言文字形式的免费在线辞典。汉...

  • 台湾期刊文献

    台湾期刊文献

    收錄範圍  「臺灣期刊論文索引系統」主要收錄本館館藏之臺灣出版的中西文學術期刊、學報以及部分港澳地區出版的期刊逾5000種。館藏民國以前之學術期刊亦陸續回溯建檔...

  • 引得市

    引得市

    「引得市」是筆者(陳信良)創建於2012年7月、主要內容係古文字相關的字典索引資料庫。從紙本書籍數位化製作,再轉成資料庫提供網路檢索使用。目前引得市「語文辭典」...

  • 茶马古道

    茶马古道

微信二维码