首页技术服务技术资讯

DNA混合图谱分型技术谈(四)—贡献者数量的推断

2022-07-28

DNA混合图谱中的贡献者数量该如何确定?

在对DNA混合图谱进行拆分的时候,贡献者数量是个重要的参数,会对混合图谱的拆分产生重要影响。

对于案件样本来说,真正的贡献者数量往往是个“谜”,那么我们该如何对贡献者数量进行估算呢?有没有好的方法可以推断贡献者的数量?目前贡献者数量的计算方法有:

--Maximum Allele Count (MAC)  最大等位基因数法

--Maximum Likelihood Estimation (MLE)  最大似然比估算法

--Bayesian methods (e.g. NOClt)  贝叶斯法

--Machine learning methods (e.g. PACE)  机器学习算法

绝大多数分析人员使用MAC法进行贡献者数量的估算,同时也将峰高信息作为考量因素一起进行估算。关于MAC法,我们可以通过下面这些文章进行了解。


有研究表明,如果单独使用MAC法进行贡献者数量推断时,容易出现如下图的情况,即随着贡献者数量的增加,MAC法推断的结果会比实际贡献者数量少1。例如,4人混合的样本,利用MAC法进行推断的话,有78%的可能性会得出3人混合的结果。并且随着贡献者数量的增加,这种可能性也会增加——6人混合的样本,MAC法推断的结果有99.99%和85.99%的可能性得出为5人混合。


针对上述的情况,我们可以通过考虑更多的位点进行推断,来降低这种情况的出现,或者将峰高考虑进来也会提高这种方法的准确性。

我们一起来总结下,如何推断混合样本中的贡献者数量:

1. 看图谱的质量,如果图谱质量很差,例如有严重的降解和抑制现象、随机扩增明显、背景噪音明显等,建议重新电泳检测;

2. 利用自己的专业知识,排除随机产生的信号和Stutter信息的影响;

3. 数出位点下等位基因的最大数量,然后四舍五入到最近的偶数,再除以2,得出的就是最小的贡献者数量;

4. 试着把每个位点下的等位基因进行配对,如果配对的等位基因峰高存在明显的不均衡,那么贡献者数量就加1;

5. 估算样本的混合比例,是否跟你推断的贡献者数量匹配。

我们举例说明一下:

例1.


图谱质量:峰高没问题,背景噪音干净;

等位基因数量:4个;

贡献者数量:2(4除以2);

混合比例:可能为3:1。

例2.


图谱质量:背景噪音干净,峰高比较低,有可能有随时扩增现象;

等位基因数量:4个;

贡献者数量:2(4除以2),存在不均衡现象,2+1=3,即可能是2人或者3人混合;

混合比例:2人混合时,3:1;  3人混合时,2:1:微量。

例3.


图谱质量:峰高没问题,背景噪音干净;

等位基因数量:locus 1, 4个; locus 2, 3个;

贡献者数量:locus 1, 2(4除以2);locus 2, 2(3+1除以2);

混合比例:locus 1, 2:1;locus 2, 2:1。


 

下一篇: