类义句搜奇

类义句搜奇

所属分类:古籍网

官方网址:http://jiuge.thunlp.org/souqi/

-- -- 0

站点介绍

AI“九歌”中国古诗词类义句搜奇(简称“九歌类义句搜奇”)由清华大学自然语言处理与社会人文计算实验室研发。整个研发工作在孙茂松教授组织和指导下完成。研发团队成员任务分工如下:核心算法设计及实现(郭志芃、胡锦毅、梁健楠);展示系统实现(刘文长)。团队设计了一种基于深层神经网络模型BERT及针对古诗词特点的改进最长公共子序列匹配相融合的类义句检索算法,可以更好地反映古诗词中的复杂语义,其检索结果也因之更为准确、细致、丰富。此外,团队利用Annoy技术实现了一个以树为数据结构的近似最近邻搜索机制,以最大限度地提高两个稠密向量之间相似度计算的速度;还实现了一个基于倒排索引的最长公共子序列优化机制,以最大限度地提高字符串匹配速度。

相关推荐

  • 方言分布GIS

    方言分布GIS

    包括:语言方言地图GIS、上古音、中古音查询、音系特征GIS。

  • 数字敦煌

    数字敦煌

    敦煌石窟是中国古代文明的一个璀璨的艺术宝库,也是古代丝绸之路上曾经发生过的不同文明之间对话和交流的重要见证。“数字敦煌”项目利用先进的科学技术与文物保护理念,对...

  • 国图民国期刊

    国图民国期刊

    是以馆藏民国期刊的缩微胶片数字化资料为基础建设的数据库,预计将在三年内完成近600万拍缩微胶片的数字转换。

  • 汉籍数字图书馆

    汉籍数字图书馆

    传世文献库是由陕西师范大学出版总社开发制作的大型古籍数据库产品,收录文献按照“经、史、子、集、丛”五部分类,依据部、类、属以及版本、印本、图版文件等分层结构组织...

  • 全唐诗分析

    全唐诗分析

    《全唐诗分析系统》包含57000多首唐诗。可进行全文检索、重出诗检索、诗人小传检索和高级检索,支持严格数据检索和简繁体混合模式检索。具有重出诗提取、格律诗标注、...

  • 50年来整理出版清代诗文集书目

    50年来整理出版清代诗文集书目

    该库所收包括1949年中国大陆及港台地区整理出版(含影印、点校)的清代诗文集书目数据2000多条。凡我馆已收藏的品种均注明馆藏号。

微信二维码