找到232个数据集

过滤结果
  • FRMESE:细颗粒度风险主体抽取数据集

    A Fine-Grained Dataset for Chinese Event Subject Extraction in Financial Risk Management 背景介绍...
  • LIPKG:寿险产品图谱

    A Knowledge Graph in Life Insurance Products 背景介绍 寿险领域的事实往往涉及到以下要素:产品要素,承保责任,承保疾病等。为了满足知识推理和产品比对,太保科技联合太保寿险,以产品概念知识库为基础,结合产品属性之间的关系,构造了一个涵盖实体和概念的多层级中文寿险领域知识图谱,简称LIPKG。 内容简介...
  • IREE:投资领域细颗粒度风险事件抽取数据集 热门

    A Dataset for Chinese Event Extraction in Investment Research 背景介绍...
  • XBMU-QandA 热门

    西北民族大学问答信息
  • 需求文本数据 热门

    标注了不可验证需求、不完整需求、模糊需求等需求文本中常见的表述缺陷问题。
  • ACE实体关系数据集 热门

    开源图谱评测数据
  • DuIE2.0中文关系抽取数据集 热门

    DuIE2.0是业界规模最大的中文关系抽取数据集,其schema在传统简单关系类型基础上添加了多元复杂关系类型,此外其构建语料来自百度百科、百度信息流及百度贴吧文本,全面覆盖书面化表达及口语化表达语料,能充分考察真实业务场景下的关系抽取能力。
  • mdo_dataset 热门

    以常见的医学文档——医学指南文献和药物说明书文档中的医药信息为基础,用细粒度知识表示方式将这两部分知识全面完整、细粒和可循证表示。同时针对模型内容给出三个方面的推理规则并举例,最后使用IAA标准对模型进行检测,结果表明该模型能融合、一致和可循证地表示医药学知识。
  • 石油勘探开发数据集

    该数据集没有简介

  • 人物百科知识图谱 热门

    该知人物识图谱以百度百科为基础数据集自顶向下构建而成,抽取分析其中的人物部分,总共包含人物实体2,480,097个,数据包含原始页面,图谱三元组(包括人物属性和人物关系)以及本体。数据可以辅助人物相关应用、问答系统等,目前第一版只考虑了利用了文本部分数据,后续会进行多模态数据的更新。
  • DuEE1.0中文事件抽取数据集 热门

    DuEE1.0是百度发布的中文事件抽取数据集,包含65个事件类型的1.7万个具有事件信息的句子(2万个事件)。事件类型根据百度风云榜的热点榜单选取确定,具有较强的代表性。65个事件类型中不仅包含「结婚」、「辞职」、「地震」等传统事件抽取评测中常见的事件类型,还包含了「点赞」等极具时代特征的事件类型。数据集中的句子来自百度信息流资讯文本,相比传统的新闻资...
  • DuEE-fin金融领域篇章级事件抽取数据集

    DuEE-fin是百度发布的金融领域篇章级事件抽取数据集,包含13个事件类型的1.17万个篇章,同时存在部分非目标篇章作为负样例。事件类型来源于常见的金融事件,数据集中的篇章来自金融领域的新闻和公告,覆盖了真实应用场景中诸多难以解决的问题。
  • 2014年NLPCC实体链接数据集 热门

    NLPCC 2014 评估任务测试数据
  • OntoNotes5.0数据集 热门

    开源图谱评测数据
  • CoNLL2003数据集

    开源图谱评测数据
  • 2015年NLPCC实体链接数据集

    该任务来自NLPCC 2015评测任务,该任务的目标是对短queries中的实体进行识别并链接到对应的中文知识库中。本数据集包括一个中文知识库,该知识库来自各类中文百科的信息框,包括中文维基百科和百度百科。该数据集还包括每个实体页面的第一段作为该实体的摘要。
  • 知识工厂实体链接数据集 热门

    基于CN-DBpedia的短文本实体链接测试数据 数据集的文本由1037条人工标注的短文本语料组成。其中大约70%来自新闻语料,包括新闻标题和内容,比如“英超-桑切斯4分钟内梅开二度阿森纳3-2五轮不败”;大约20%来自人工构建的基于歧义实体的语料,比如“红楼梦的演员有哪些”;大约10%来自问答语料中的简单问句,比如说“岳阳有哪些旅游景点”。
  • YAGO3-10知识表示数据集 热门

    开源图谱评测数据
  • WN18rr知识表示数据集

    开源图谱评测数据
  • WN18知识表示数据集

    开源图谱评测数据
您也可以使用应用程式界面 (看 API文献)注册.