
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
一、前列腺癌标准数据集使用说明
1.数据集说明
该标准数据集参考国家电子病历及信息化行业标准、权威指南、术语规范以及高影响因子或高引用率文献,由国内前列腺疾病领域专家牵头,征集各分中心及网络单位的专家学者建议审核制定。该套标准数据集共有20个部分,682个数据元。数据集由相应部分名称、相应部分序号、数据元名称、值域/数据类型、数据加工、来源组成。
(1)子模块/数据元:
每个模块下面包含详细的字段。如“人口学信息”数据模块包含姓名、年龄、民族等多个字段。
(2)值域/数据类型:
参考主要指南标准,从前列腺癌专家实用性出发的值域作为主要的归一标准。
(3)数据加工:
根据数据来源及数据上层加工处理,数据加工主要分为3类:①分别直接映射存储规范的数据,如检验数据。②需要通过结构化和归一算法,将大段自然语言处理为标准字段和阈值,并可进行统计分析,如AJCC分期-临床分期。③同一个患者需要根据多份病历或多次结果,多系统来源数据,有时间逻辑地进行多种形式的关联和复杂逻辑计算,如术后病理来源于手术系统及病理系统,按时间顺序进行换算。数据加工根据每个场地数据源情况改变,如一些表单已存在前结构化表单,后续数据加工方法则更改为直接映射。
(4)来源:
主要参考国际国内术语标准如国际疾病分类(ICD)第10版,不良事件的通用术语标准(CTCAE)5.0版等,电子病历基本数据集、电子病历共享文档规范以及国际国内疾病标准指南(如CUA)等。