找到2个资源集

过滤结果
  • 基于众包标注系统的文言文语言理解测评基准及数据集 热门

    C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件,可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持,以通过高度关联化数据的方式构造及展现...
  • 天津大学开源查询回答系统-SUMA 热门

    一种基于部分物化方法的高效的查询回答系统; 支持OWL 2 DL本体,并且以Pellet为完备性评估标准,SUMA在8个测试查询上完备性高于PAGOdA; 采用低复杂度的物化算法并且为数据和规则构建三级索引,实现高效的物化; 支持单机亿级规模的三元组实时推理,在三个Benchmark数据集上预处理时间(包括物化时间)比PAGOdA快七倍;...