- 提高阳性率之——可信赖的数据分析
前面讲要提高阳性率,就要尽可能的扩大检测范围,并且要做家系Trios策略。但检测出来是相对容易的,检测出来的海量数据能否分析出来则是相对难得多、技术含量高得多的挑战。要选择可信赖的数据分析平台或机构。
怎样的数据分析才是可信赖的呢?
涵盖三要素
生物+遗传+临床,三要素同时支持致病性判断,这是一个变异的致病性的充分必要条件。数据分析平台应基于这三要素,对海量变异进行分级筛选。(详见:《详解:关于遗传病精准诊断阳性率的探讨》)
生物学要有五级致病性分析
分析程序兼容大(CNV)、中(外显子缺失重复)、小(点突变)三种类型。
对已报道变异,要能支持海量文献数据库的索引。对未曾报道的变异,要能提供变异对蛋白结构的预测性分析,而且要基于不止一个软件。
要基于多个公共数据库、尤其是中国人种的万人级别以上的数据库的MAF值,去过滤无害变异。
要兼容ACMG变异评级标准中的分析内容,包括保守性分析等。
遗传学要有共分离分析
要基于家系Trios模式,进行遗传共分离分析。
临床表型分析要基于结构化数据库
要基于结构化的人类七千种遗传病的临床表型数据库,结合患者的临床特征,进行匹配分析。
要有自动综合评级
要能提供结合三要素分析之后的自动综合评级结果,这样才能减轻人工分析的压力。
数据质量、分析依据要透明展现于在线平台
数据分析的逻辑和过程,以及综合形成的分析判断依据,都应展示于在线平台上,可供医生查看。
要可参与
在线平台能支持医生参与分析,提供方便的筛选、排序等功能,提供临床特征的在线修改、即时匹配。
要基于中国人的遗传病患者大数据
分析系统应基于中国人的遗传病患者的全外显子家系的大数据,这样才有可能结合大数据进行精准诊断。