三、三要素分析:海量数据“百万挑一,大海捞针”
三要素找交集
临床级数据分析是需要对三个要素进行分析,第一个要素是分析生物学意义,也就是分析这个变异是否影响基因功能,第二个要素是分析遗传学意义,也就是结合遗传方式去分析这个变异是否支持阳性诊断,第三个要素是分析患者的临床特征和变异对应的疾病特征是否匹配吻合。只有这三个要素的交集部分,才有可能是患者的致病突变,才可以辅助临床诊断。
- 临床级基因数据分析要素一:生物学意义分析
第一个要素就是分析变异的生物学意义,就是分析变异是否有危害性。基因检测与其他医学检验有一个很大的不同,就是基因检测没有标准值。基因分析给出的只是一种可能性。生物学意义分析就是要尽量将这种变异导致危害的可能性、不确定性转化为确定性。
我们把危害性按照5级分级体系来分类,这样的分类体系和美国的ACMG今年提出的五级分类体系完全一致,而智因东方(原德易东方)是两年前就提出来的。这个横轴代表变异的不确定性,纵轴代表变异的危害性,我们将变异分为致病(强阳)、可能致病(弱阳)、中性、可能不致病(弱阴)、不致病(强阴)这五级。越往上变异危害性越高,越往下变异危害性越低。越往左变异意义越确定,越往右变异生物学意义越不确定。
强阳是高度确定的高危害性变异,强阴性是高度确定的不导致疾病的变异;
弱阳是倾向于认为有危害性,弱阴是倾向于认为不导致疾病,这两类有一定的不确定性;
还有一些变异是完全不能确定致病性,就是中性,但不能排除致病性。
那该如何判断一个变异应该属于哪一级危害性呢?首先是要确认阴性变异予以剔除,智因东方(原德易东方)建立了自有的万人基因组数据库,通过正常人分布频率进行分析,那些分布频率高的可以确认为阴性。剔除阴性变异后进一步需要确认阳性变异,比如有致病性文献报道的变异,或者是从理论上就能预测会明显影响蛋白功能的,这类预测的准确性在80%左右。
- 临床级基因数据分析要素二:遗传学意义分析
第二个要素是遗传学意义分析,就是结合变异状态以及变异疾病的遗传方式进行判断。对于常染色体的基因来说,一般每一个基因都有两个等位基因,一个来自父亲,一个来自母亲。在两个等位基因上只有一个等位基因存在一个变异,就是单杂合,如果变异相关的疾病是常染色体显性遗传病,只要有一个单杂合的高危害性变异就能致病,但是如果是常染色体隐性遗传病,必须是两个等位基因都存在有害变异,也就是纯合或者复合杂合才能致病,复合杂合是指两个等位基因上分别有一个有害变异,纯合是复合杂合的特殊情况,就是两个变异位置相同。
- 临床级基因数据分析要素三:临床特征分析
对于全外显子测序数据来说,通过前两级的过滤分析仍然会剩下几百个变异,国外一些著名的医学院的遗传病分析流程就只能做到这里了,剩下至少200个变异需要让医生一个一个人工去看去分析,而智因东方(原德易东方)还可以进一步筛选,进行最后一个要素的分析——临床特征分析。智因东方(原德易东方)建立的分子医学数据库,包含有数千种疾病的致病基因和临床特征,这里面每一个变异基因的关联疾病的临床特征都在我们的数据库中,把患者的临床特征同这些变异对应的临床特征逐一进行匹配,最后找到和患者最相匹配的表型,这可能就是最终的答案了。
- 基因变异致病性综合评级
上述三要素分析只是一个分析逻辑,在分析系统中则是非常复杂的算法,最终会对每一个变异的致病性给出综合评级。新版的系统会同时给出智因东方(原德易东方)三要素评级和ACMG综合评级的两种评级结果。
这里要注意的是,实验室给出的并不是最终的疾病诊断,实验室结果不能代替临床诊断,只是给诊断提供参考。最终的诊断是需要医生参考基因结果,结合其他临床指征,包括各种其他实验室检查,进行综合判断得出的。全谱®基因筛查的最大价值在于将高通量测序得到的海量变异最终精选到为数不多的几个,从而给诊断提供重要的方向、线索和参考,提升了诊断的效率。