中古汉语标记语料库

中古汉语标记语料库

所属分类:古籍网

官方网址:http://lingcorpus.iis.sinica.edu.tw/middle/

-- -- 0

站点介绍

「中央研究院中古漢語語料庫」 是「中央研究院古漢語語料庫」的一個次語料庫。 「中央研究院古漢語語料庫」是應漢語史研究需求 而建構的語料庫。這個語料庫又可依是否經過斷詞及加標詞類而分成兩類,即未加標的素語料庫以及 有標注的標記語料庫。 目前素語料庫所蒐集的語料已含蓋上古漢語(先秦至西漢)、中古漢語(東漢 魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料,並已陸續開放使用; 在標記語料庫方 面,上古漢語、中古漢語、近代漢語亦皆已有部分語料完成標注的工作,並視結果逐步提供線上檢索。
「中央研究院古漢語語料庫」的建構始於1990年,創始者為黃居仁(語言所研究員)、譚樸森(英國倫敦 大學亞非學院教授)、陳克健(資訊所研究員)、魏培泉(語言所研究員)等, 最初的經費來源為蔣經國 基金會及中央研究院歷史語言研究所,目標是蒐集上古漢語的素語料。素語料庫的構建自此未曾停 歇,語料也由上古漢語擴充到中古漢語和近代漢語。
這個蒐集工作的持續基本上是由魏培泉負責執行,經費來源主要為中央研究院。上古漢語語料的標 注自1995年開始進行,近代漢語的標注從1997年開始規劃,隨後即付諸實行, 主其事者為魏培泉 與劉承慧 (清華大學中文系教授)。中古漢語的標注則從2011開始。支持這個標注工作的經費主 要來自中央研究院及國科會,在標注及搜檢的技術方面則有黃居仁、陳克健及本院資訊服務處的協助。

相关推荐

  • 自动句读

    自动句读

    支持自動標記句讀標點、書名、專名等。即使處理大規模文本,仍能立等可取。基於先進的深度學習(DeepLearning)算法,通過在數十億字古漢語文本上進行長時間訓...

  • 全球汉籍GIS

    全球汉籍GIS

    “全球漢籍分佈GIS系統”(以下簡稱“本系統”)是“中國古典文獻資源導航系統”(奎章閣)的子系統,屬於數字人文基礎設施(cyberinfrastructure)...

  • 郡斋读书志

    郡斋读书志

    《郡斋读书志》初成于高宗绍兴二十一年(1151),终成于孝宗淳熙七年至十四年(1180~1187)。共著录晁公武实际收藏图书一千四百六十八部,基本包括了南宋以前...

  • 典藏古籍库

    典藏古籍库

    典藏古籍库

  • 古联OCR

    古联OCR

    古联公司基于机器学习技术研发的面向古籍的智能OCR(图像文本识别)系统,主要处理版刻、写本等各式版本类型的古籍图像,具有智能版面分析、智能成分标注及标注结果的输...

  • 甲骨拓片 国图

    甲骨拓片 国图

    被誉为二十世纪四大文献发现之一的甲骨文,集文献性、文物性、收藏性于一身,是研究我国商朝晚期不可多得的珍贵史料,该库包括北京国家图书馆甲骨拓片:元数据2975条,...

微信二维码