- 总体需求 响应国家健康医疗大数据、人工智能发展规划及要求,适应全国医院信息化未来发展趋势,充分发挥临床数据在科研领域的价值,建设心内专病库数据库,服务我院数字化转型和高质量发展。 2.招标内容 序号 建设内容 数量备注1 心内专病数据库 1 3.总体技术要求 3.1 技术架构要求 (1)技术架构须基于 Hadoop 技术框架,采用大数据存储技术,支持并行计算基础架构,具备大数据存储访问及分布式计算任务调度的能力;(2)须采用分布式搜索引擎技术,实现数据的快速查询及调阅,并可支持不同平台的应用,实现全院范围数据的秒级检索; (3)▲须具备数据库同步技术和 ETL 技术,在不影响医院原始生产业务数据库的情况下,对数据进行抽取、同步、汇集,实现针对医院多源异构数据的采集和汇聚; (4)须采用机器学习和人工智能技术对数据进行数据标准化、结构化等处理,基于语义分析技术构建疾病知识图谱。 (5)支持私有化部署,所有系统和数据均部署在院内;(6)支持采用无状态服务高可用设计,系统支持7*24 小时不间断运行;(7)支持采用容器化的部署方案,支持动态扩展;(8)支持采用文档型数据库存储数据,灵活可扩展;(9)支持秒级个案查询和计算分析的需求和后期扩容。3.2 运行环境要求 (1)支持主流 linux 操作系统; (2)支持主流的浏览器; (3)支持与医院业务系统或大数据平台对接。4.建设内容具体要求 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 264.1 数据治理要求 4.1.1 大数据采集与汇聚 平台须通过数据库同步技术和 ETL 等技术,对数据进行抽取、同步、汇集,实现针对医院多源异构数据的采集和汇聚。需要将相关信息系统的历史数据及增量数据进行集成接入,支持从院方集成平台获取、也支持直接从业务信息系统备份库获取。 数据接入范围: (1)医疗机构信息系统(HIS):患者、挂号、入出转、就诊、处方/医嘱、申请、收费、三测单等信息; (2)实验室系统(LIS):标本、检验结果等信息;(3)超声信息系统:超声检查、超声报告等信息;(4)病理信息系统:病理检查、病理标本、病理报告等信息;(5)内镜信息系统:内镜检查、内镜报告等信息;(6)放射信息系统:放射检查、放射报告等信息;(7)心电信息系统:心电检查、心电报告等信息;(8)电子病历系统(EMR):入院记录、出院记录、病程等病历信息;(9)护理系统:护理记录、观察记录、护理文书、用药记录等信息;(10)病案管理系统:病案首页信息; (11)重症监护系统:重症护理记录、观察记录、护理文书、用药记录等信息;(12)手术麻醉系统:手术记录、事件、用药等信息。4.1.2 患者主索引 须通过患者主索引,整合患者历次就诊数据,建立患者维度的数据集,实现患者全景视图的展现;对多源、异构的数据进行处理,形成统一、标准的大数据视图。4.1.3▲数据脱敏与加密处理 对患者数据进行数据脱敏和加密处理,去除或隐藏患者个人信息中的敏感信息。通过脱敏或加密规则进行数据的变形,实现敏感隐私数据的可靠保护,同时保持其它数据的格式和属性,保证其可识别性和可用性。 4.1.4 数据清洗 将医疗数据中,因各种原因或不明原因导致的不规范、错误的字段信息进行清洗,避免因部分明显错误的信息导致上层应用服务的结论错误。18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 274.1.5▲数据标准化处理 基于国内、国际、医疗行业、国际疾病指南等标准,对采集数据进行标准化、归一化处理; 4.1.6▲数据结构化处理 通过自然语义处理(NLP)技术,结合医疗专业术语的语义结构,将医疗语义信息从原始的自然语言表达,为后续的应用、挖掘、机器学习提供基础数据支持;4.1.7▲数据质控管理 针对数据处理过程中的多层数据,采用定量、定性综合校验方法,提供多维质量监控、问题预警功能,协助大数据、人工智能平台发现数据完整性、一致性、准确性、唯一性、稳定性等数据质量问题。 4.2 心内专病库功能要求 4.2.1 我的首页 在我的首页里,为各类用户角色提供差异化的所需、所关注的内容及快捷入口,帮助用户提高工作效率。 (1)首页宣传栏 用户可宣传研究最新进展及产品新功能介绍。 (2)专病库简报 查看专病库内整体患者及用户概要信息,包括全库患者数量,数据库纳排条件、数据库内项目数量,数据的时间跨度,数据库内成员数量。(3)待办事项 查看项目待办任务。 (4)任务通知+系统通知 查看所有与用户相关的任务及项目的通知,查看系统通知。(5)导出记录 查看当前用户数据的导出记录。 (6)疾病运营指标 ①可定制化运营指标统计(限库内已有指标)。②运营指标可按从高到低、从低到高排序。 ③运营指标可按多种形式展现。 (7)我收藏的患者 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 28查看用户收藏的患者。 (8)领域近期临床试验 展示国内外权威平台上领域内最新临床试验。 (9)领域最新文献 支持展示国内外权威平台上领域内最新文献。 4.2.2 洞察分析 医疗科研人员,可通过洞察分析,了解目前在专病智能平台里的患者分布等情况,了解和定制关键指标分析等信息。 (1)数据库概览 ①支持查看科室数据库患者总数。 ②支持查看科室专病库收入患者的就诊时间跨度。③支持查看科室专病库收入患者的纳排标准。 ④支持查看最新数据更新时间。 (2)患者特征分析 ①支持对科室数据库内患者进行数据透视,了解患者特点分布情况。②支持以饼图、条形图、柱状图、散点图、折线图、玫瑰图、环形图等多种形式显示患者分布结果。 ③支持按照门诊、住院等不同就诊类型查看。 ④支持对人群进行性别、就诊类型等条件的筛选,以查看不同类型患者的主题分析图表。 ⑤支持通过分析图表快速搜索符合特征的患者(下钻到对应的患者列表)。⑥支持数值和文本指标的值域进行自定义归并设置。⑦支持下载分析图表数据。 4.2.3 病例检索 提供的病例搜索功能能够支持 TB 级数据的在线实时模糊搜索、高级搜索等查询,并在秒级时间内响应。 (1)患者 360 详情 ①查看患者全生命周期科研数据。 ②定制化的科研指标及指标分组方式(限库内已有指标)。③查看患者的检验项目指标的时序变化图。 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 29④检验项目指标异常值特殊标记。 (2)患者时间轴 ①支持专科特色患者时间轴: ②支持按时序展示患者历次住院、门急诊诊疗事件。③支持查看患者诊疗事件的发生时间、诊断名称、就诊/入院科室信息。④在同一时间轴跨度下查看指标的进展情况。 ⑤支持选取指定时间区间,查看该时间区间内的就诊记录。⑥支持查看时间区间内的检查、检验指标的变化趋势,并突出提示异常值。(3)数据溯源 支持查看每一条患者科研数据的计算逻辑及其源头数据。(4)简单搜索 ①输入关键词快速检索与关键词相关的患者,可查看相关患者对应的患者特征统计图表。 ②支持使用智能联想的关键词一同搜索,精准扩大搜索范围。③支持搜索时选用自然语言处理技术,提升搜索准召率。④查看搜索到的患者数量。 ⑤搜索结果命中飘红,精确解释每位患者被搜索到的原因。⑥查看与关键字相关的中英文文献。 (5)高级搜索 ①为具体指标设置搜索条件,精确搜索患者。 ②支持纳入搜索、排除搜索两种搜索模式,且支持两种模式同时作用,快速完成科研纳排过程。 ③支持条件树搜索、事件搜索、精确搜索(住院号、门诊号、病案号)搜索三种搜索方式,且支持三种方式灵活搭配。 ④搜索历史自动留存;搜索条件收藏。 ⑤秒级查看搜索到的患者列表及患者详细数据。(6)高级搜索-条件树搜索 ①以树状形式添加多个搜索条件,支持复杂条件搜索。②多个搜索条件之间的“并且”“或者”关系灵活切换。③多个搜索条件的搜索数据范围灵活限定。 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 30④不同类型数据不同搜索规则,数值型指标采用“大于”“小于”“等于”等规则,文本型指标采用“精确等于”“包含”“不包含”等规则。⑤支持在搜索条件上添加“首次”、“末次”的限定条件。⑥支持为数值型指标添加“最高”“最低”的限定搜索条件。⑦支持为检验指标添加“高于/低于几倍正常高值/低值”的限定搜索条件。⑧计算全部条件节点综合搜出的总患者数量。 ⑨计算每个条件节点上搜索出的患者数量,快速了解患者流向。⑩搜索条件选项包含专病库所有变量。 (7)高级搜索-事件搜索 ①通过定义 T0 事件与事件前后的条件,精确搜索患者。②支持多条件组合,精确定义 T0 事件(T0 事件可以是一个条件,也可以是多个条件的组合。 ③支持基于 T0 事件,在其前后添加多个限定条件。④灵活配置事件前后多个条件之间的关系。 ⑤计算满足 T0 事件与前后限定条件,综合搜索出的总患者数量。⑥计算满足 T0 事件的总患者数量。 ⑦基于 T0 事件,分别计算满足各个条件的患者数量与占比。⑧支持多事件搜索,添加新事件搜索是可选择空白搜索或复制上一个事件搜索。(8)高级搜索-精确搜索 支持通过住院号、病案号、门诊编号等信息,批量进行精确搜索找到目标患者。(9)文献推荐 查看与搜索内容相关的中英文文献。 (10)患者列表 ①自定义患者列表页需展示的重要基线指标。 ②点击列表中的一个患者,进入该患者详情页面,查看全景数据。③进入一个患者的时间轴页面,查看重点诊疗事件各项指标,以及重要指标的时序进展情况。 (11)患者重点指标分析 统计每次高级搜索结果患者的重点指标分布情况。(12)患者数据导出 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 31①导出搜索到的患者数据至 Excel,支持 sas 和 spss 等多种常用的统计软件。②支持导出患者的多个指标全生命周期数据。 ③支持为待导出的指标限定时间阶段,导出特定一次的值。④支持阶段内多种指标导出规则:首次、末次、最大值、最小值、平均值、求和、所有值等。 ⑤根据用户权限支持导出明文数据(可逆脱敏)。⑥保留所有用户的数据导出记录,便于管理。 (13)患者数据导入科研项目 将搜索出来的患者直接导入到科研项目,进一步做核查、随访、缺失值处理、编码、统计分析等科研操作。 4.2.4 科研项目 线上化的支持科研课题管理全流程,帮助用户完成科研项目,提升科研效率;包括:创建项目->纳排患者->课题指标选取计算->随访管理->项目数据补录核查->线上统计->统计结果导出。 (1)创建项目 ①支持创建多个单中心研究项目并发布。 ②支持添加项目描述说明及项目附件,用于对项目成员公开资料。(2)研究设计-患者纳排 ①支持创建多个研究队列,不同队列设置不同的纳排条件。②针对前瞻性研究,支持患者随机分组。 ③支持三种搜索方式结合,将满足各队列条件的患者分别纳排入组(三种搜索方式细节见搜索功能介绍:条件树搜索、事件搜索、精确搜索)。(3)研究设计-指标数据自动采集 ①专病库内所有指标均可被选取为项目研究指标,形成一个患者一行的研究数据。 ②创建多个研究阶段表单,为不同阶段表单配置研究指标。③将指标配置为多种 CRF 题型,包括:填空题、单选题、多选题、表格题、文件题、日期题、长文本题。 ④灵活定义观测阶段,支持首次 末次。 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 32⑤灵活定义研究指标的抽取规则:首次、末次、所有次、最大值、最小值、平均值、求和、计数。 ⑥支持灵活定义科研多来源字段并自动抽取数据,举例,是否转移、是否复发等。 ⑦支持用户自定义添加专病库内未有指标,并人工补录数据(已支持文本题型、数值题型、日期题型、枚举题型)。 ⑧自定义研究指标在科研项目中的名称。 (4)数据预处理 ①支持查找并批量替换指标数据。 ②支持使用平均值、中位数、众数替换缺失值。③支持使用项目内其它指标作为条件,批量填充某个指标的数据。(5)项目成员管理 ①支持添加多位录入员,进行数据校验工作。 ②添加一位数据管理员,负责数据导出。 (6)项目内患者随访 ①项目发起者可发布随访计划,支持电话/门诊方式随访、短信方式随访。②支持自定义随访次数、随访频率和随访开始时间。③支持配置随访 CRF,CRF 题目支持使用疾病标准数据集指标和用户自定义添加指标。 ④支持设置随访任务提醒,提醒随访医生在每个随访点要做的其他任务。⑤支持随访数据批量填充。 ⑥支持设定自动终止随访规则,自动终止随访。⑦支持设定不良事件触发规则,自动提醒不良事件。⑧短信随访,支持给患者发送短信,患者在移动端填写随访表单并实时回传数据。 ⑨根据随访规则自动生成随访任务。 ⑩录入员可根据随访任务调度,以 CRF 问卷形式手工录入随访数据。⑪随访发布后仍可继续增加随访阶段任务。 (7)补充添加数据库外的研究对象 ①支持手动添加患者进入科研项目。 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 33②支持通过 excel 批量导入入组阶段和随访阶段数据。(8)剔除研究对象 支持删除已添加的研究对象。 (9)数据溯源 支持查看每一条患者科研数据的计算逻辑及其源头数据。(10)对照病历智能录入项目数据 ①支持录入员使用多种 CRF 题型录入数据。 ②录入时支持双屏对照原始病历。 ③自动定位病历数据,快速找到待录入的数据。④录入员对数据每一次的更改或补充,系统会自动保存历史记录。(11)项目内搜索患者 支持在所有指标范围内模糊搜索。 (12)项目数据锁定 数据锁定后,项目成员无法再对数据进行更改。(13)项目数据导出 项目数据快速导出至 Excel 或 CSV 文件,支持 sas 和spss 等多种常用的统计软件。 (14)项目进度统计及管理 项目核查进度统计和随访进度统计。 4.2.5CRF 管理 CRF 管理模块展示用户自己创建的 CRF 模板和系统CRF 模板。(1)创建 CRF 模版 ①支持自定义线上 CRF 表单。 ②支持使用专病库的标准数据集指标作为 CRF 题目。③支持用户自定义建题,题型包括:单选题、多选题、日期题、附件题、多行文本题、矩阵题、组自增题、纳排题、随机分组题和填空题,其中附件题支持上传ts、xls、xlsx、ppt、ppts、doc、docx、pdf、txt、png、jpg、jpeg、gif、bmp、zip、m3u8、dcm、rar18 种格式的附件。 ④支持拖拽和点选两种建题方式。 ⑤支持设置题目一些特定属性。 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 34⑥支持设置题目间隐藏和显示逻辑。 ⑦支持将一张 CRF 分为多个题组展示。 ⑧支持题组维度选择单列或双列展示模式。 (2)CRF 模板管理 CRF 模板列表展示所有已创建的模板,每个模板展示CRF 名称、创建时间、更新时间及包含的字段。 4.2.6 高级统计分析 (1)数据自动编码 统计分析时,为科研项目中的数据自动进行编码。(2)变量有效填充率自动计算 计算指标有效填充率,对于分类型指标和连续型指标计算方式不同。(3)变量值域排序 支持为有序分类变量更改值域顺序。 (4)描述性统计 为科研项目中的变量进行基本统计量的计算。 (5)单因素分析 支持单变量的单因素组间比较,目前支持 t 检验、矫正t 检验、秩和检验、单因素方差分析、Pearson 卡方检验、Fisher 精确概率法、CMH 线性趋势检验、Ridit分析法等统计学检验方法。 (6)相关性分析 支持两变量间的相关性分析,目前支持 Pearson、Spearman、列联系数、Phi、Cramer’s、Eta2 等相关分析方法。 (7)连续变量分段 支持将连续变量分成多段,作为分类变量用于统计分析。(8)统计分析结果 统计分析的结果。 (9)多因素分析 支持逻辑回归、线性回归、逐步回归。 (10)生存分析 支持 Cox 回归与 KM 生存曲线,支持生存时间计算。18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 35(11)上传独立数据集 支持上传 excel/csv 格式的文件,自动识别变量类型,全部统计分析方法均可用在用户上传的独立数据集上。 4.2.7 知识全库 知识全库主要包括了文献搜索、疾病相关指南、药品说明书、临床路径、以及作者图谱及研究热点等搜索功能。 (1)文献搜索 连接 Pubmed、万方文献等知识库,支持中英文搜索,支持按照相关性排序。(2)疾病相关指南搜索 医脉通知识库,支持中英文搜索,支持按照发布时间、相关性排序。(3)药品说明书 连接药典、寻医问药、39drugs 等药品说明书知识库,支持中英文搜索,支持按照相关性排序。 (4)临床路径 支持搜索及查看与疾病相关的临床路径指南。 (5)作者图谱及研究热点 查看与疾病相关的文献作者网络图谱及研究热点。4.2.8 数据字典 数据字典开放既往与全国知名专家共建的疾病数据集,包括:字段定义、值域、加工方法、来源;数据字典能够透明化每个字段的填充率统计,方便用户感知数据质量。 (1)字典定义 ①字典定义,包含字段指标名称(含中英文)、字段说明、值域标准、数据类型、数据提取规则。 ②支持自定义每个指标的 CRF 题型和选择题选项(题型支持:单选、多选、填空、日期、矩阵题、组自增题、图片题等),可应用于CRF 管理、科研项目补录、随访 CRF 设置功能模块。 (2)数据填充率 支持字段从患者维度和就诊维度统计指标的有效值数量、总人数以及填充率,通过颜色提示填充率信息。 18D8FDBD-3FFD-0779-E063-CB19FE0AEF70 364.2.9 产品使用引导及帮助中心 (1)产品新功能提示引导 (2)各功能模块内,用户提出的常见问题的解答(3)产品功能使用手册,可供在线浏览与下载(4)产品主要功能使用视频演示 (5)产品版本升级后,将及时提示新功能介绍4.2.10 系统权限管理 支持管理员赋予用户角色,授予功能使用权限;不同用户开启不同数据授权;支持专病智能平台拥有者自行为用户授权。 (1)账号、角色授权功能 专病库系统管理员能够掌管 高级用户、普通用户、中心管理员、录入员、数据管理员的用户授权。 (2)患者数据访问授权 专病库系统管理员能够为每个用户分配其能访问的患者范围(支持根据不同科室划分数据权限,划分依据可定制)。 4.2.11 消息通知 须支持平台级消息广播。 5.建设期限 本项目建设周期为 6 个月内完成。 6.售后服务期限
综合评分办法 评分办法 页 序号 标题 分值 评分标准 4.3 团队能力 8.00 根据投标人拟派服务技术人员的数量及其从事该专业的年限、经验、能力综合打分, 人员专业、经验丰富、能力强得8分,有一处不合理、不完善、存在薄弱项扣1分,扣 完为止。 4.4 实施方案 10.00 根据投标人提供的实施方案进行评审,方案合理、完善得10分,每有一处不完善或不 合理或弱势项扣1分,扣完为止。无相应内容不得分。 4.5 售后服务方案 5.00 根据投标人提供具体售后服务方案进行评审,方案应包含但不限于:售后服务响应时 间(不低于采购需求的要求)、质量保障、应急保障等内容。方案完整详细、合理、 可行性高得5分;每有一处不完善或不合理或弱势项扣1分,扣完为止。无相应内容不 得分。 4.6 演示 5.00 投标人须按照招标文件中的演示要求,自行录制MP4格式视频进行演示,制作电子投 标文件时绑定该视频,视频大小不得超过50M 评审专家根据演示完整度以及功能符合度给予评分,全部满足需求的,得5分,每缺 少一项或每有一项不满足,扣1分,扣完为止。 演示要求: (1)病例检索重点功能:须提供模糊搜索、条件树搜索、事件搜索、精确搜索,支 持搜索病人和搜索病历两种方式,须支持精准的“纳排+事件”组合搜索方式。 (2)患者诊疗全程时间轴展示查看重点功能:须支持基于某个患者重点数据的全周 期时间轴展示查看,可明确绘制出患者的多次就诊情况,用药情况,检验重点指标等 的时序进展情况。单个病人患病周期数据分类展示,须包含且不限于患者人口学信 息,医嘱、每次诊断记录,检验、检查,生物样本和基因检测结果数据等内容。 (3)数据洞察重点功能需求:支持重点指标的统计:根据指标类型展示多种统计图 表(饼图、柱状图、折线图、圆环图、矩形树图等);须支持下载统计数据;可通过 统计图上的分类情况,直接定位目标患者人群。 (4)数据字典重点功能需求:支持查看数据平台的疾病标准指标集、指标值域、取 值逻辑说明、数据来源;查看指标的填充率。 (5)知识全库重点功能需求:根据关键词搜索各类知识库摘要,知识库范围包括: 文献、临床指南、临床路径、药品说明书、临床实验、误诊误治等。能够查看与疾病 相关的文献作者图谱及研究热点。