类义句搜奇

类义句搜奇

所属分类:古籍网

官方网址:http://jiuge.thunlp.org/souqi/

-- -- 0

站点介绍

AI“九歌”中国古诗词类义句搜奇(简称“九歌类义句搜奇”)由清华大学自然语言处理与社会人文计算实验室研发。整个研发工作在孙茂松教授组织和指导下完成。研发团队成员任务分工如下:核心算法设计及实现(郭志芃、胡锦毅、梁健楠);展示系统实现(刘文长)。团队设计了一种基于深层神经网络模型BERT及针对古诗词特点的改进最长公共子序列匹配相融合的类义句检索算法,可以更好地反映古诗词中的复杂语义,其检索结果也因之更为准确、细致、丰富。此外,团队利用Annoy技术实现了一个以树为数据结构的近似最近邻搜索机制,以最大限度地提高两个稠密向量之间相似度计算的速度;还实现了一个基于倒排索引的最长公共子序列优化机制,以最大限度地提高字符串匹配速度。

相关推荐

  • 藏园群书经眼录

    藏园群书经眼录

    傅增湘撰,傅熹年整理,2009年中华书局出版。本书是北平藏书大家傅增湘的目录代表作,据傅熹年《藏园群书经眼录整理说明》,经“前后三十余年积累而成”,“经部二卷,...

  • 西夏文献 国图

    西夏文献 国图

    以北京国家图书馆保存的西夏、元代孤本及各种西夏的珍贵实物资料为基础建设的数据库。包括西夏文献:书目数据124条;原件影像近5000拍。

  • 丝绸之路

    丝绸之路

  • 三星堆

    三星堆

  • 木简库 日本

    木简库 日本

    《木简库》(MOKKAN-KO)是木简的综合检索系统。通过此系统,用户不仅可以检索记载在木简上的文字、文字图像,还可以检索与木简相关的各种信息。我们合并了《木简...

  • 进士登科数据库

    进士登科数据库

    《历代进士登科数据库》是以登科人物的传记资料为主要内容,基于知识服务的概念,利用互联网技术下的数据储存易于拓展、条目检索快捷有效、数据统计操作自动化等特点,开发...

微信二维码