DNA混合图谱分型技术谈(四)—贡献者数量的推断
DNA混合图谱中的贡献者数量该如何确定?
在对DNA混合图谱进行拆分的时候,贡献者数量是个重要的参数,会对混合图谱的拆分产生重要影响。
对于案件样本来说,真正的贡献者数量往往是个“谜”,那么我们该如何对贡献者数量进行估算呢?有没有好的方法可以推断贡献者的数量?目前贡献者数量的计算方法有:
--Maximum Allele Count (MAC) 最大等位基因数法
--Maximum Likelihood Estimation (MLE) 最大似然比估算法
--Bayesian methods (e.g. NOClt) 贝叶斯法
--Machine learning methods (e.g. PACE) 机器学习算法
绝大多数分析人员使用MAC法进行贡献者数量的估算,同时也将峰高信息作为考量因素一起进行估算。关于MAC法,我们可以通过下面这些文章进行了解。
有研究表明,如果单独使用MAC法进行贡献者数量推断时,容易出现如下图的情况,即随着贡献者数量的增加,MAC法推断的结果会比实际贡献者数量少1。例如,4人混合的样本,利用MAC法进行推断的话,有78%的可能性会得出3人混合的结果。并且随着贡献者数量的增加,这种可能性也会增加——6人混合的样本,MAC法推断的结果有99.99%和85.99%的可能性得出为5人混合。
针对上述的情况,我们可以通过考虑更多的位点进行推断,来降低这种情况的出现,或者将峰高考虑进来也会提高这种方法的准确性。
我们一起来总结下,如何推断混合样本中的贡献者数量:
1. 看图谱的质量,如果图谱质量很差,例如有严重的降解和抑制现象、随机扩增明显、背景噪音明显等,建议重新电泳检测;
2. 利用自己的专业知识,排除随机产生的信号和Stutter信息的影响;
3. 数出位点下等位基因的最大数量,然后四舍五入到最近的偶数,再除以2,得出的就是最小的贡献者数量;
4. 试着把每个位点下的等位基因进行配对,如果配对的等位基因峰高存在明显的不均衡,那么贡献者数量就加1;
5. 估算样本的混合比例,是否跟你推断的贡献者数量匹配。
我们举例说明一下:
例1.
图谱质量:峰高没问题,背景噪音干净;
等位基因数量:4个;
贡献者数量:2(4除以2);
混合比例:可能为3:1。
例2.
图谱质量:背景噪音干净,峰高比较低,有可能有随时扩增现象;
等位基因数量:4个;
贡献者数量:2(4除以2),存在不均衡现象,2+1=3,即可能是2人或者3人混合;
混合比例:2人混合时,3:1; 3人混合时,2:1:微量。
例3.
图谱质量:峰高没问题,背景噪音干净;
等位基因数量:locus 1, 4个; locus 2, 3个;
贡献者数量:locus 1, 2(4除以2);locus 2, 2(3+1除以2);
混合比例:locus 1, 2:1;locus 2, 2:1。