首页技术服务技术资讯

混合DNA图谱分型技术谈-图谱中的峰信号,究竟受到哪些因素的影响?

2018-08-20

1. PCR扩增效率(Amplification efficiency);
2. 模板量(Template);
3. 降解系数(Degradation);
4. 扩增子的分子量(molecular weight);
5. 等位基因类型(Heterozygote or Homozygote);
6. 位点特异性(Locus);

假设有如下图谱,贡献者为2,实际分型如下表

如果不考虑其他因素,分型的图谱应该如下:

1. 模板量:contributor 1>contributor 2

2. 降解因素:contributor 1> contributor 2

3. 扩增效率:Locus2 > Locus 1

4. Stutter

5. 模拟结果

STRmix生物模型考虑到了所有相关因素:

如何将生物模型应用在图谱的拆分中?

       MCMC(马尔科夫链-蒙特卡罗算法)产生于19世纪50年代早期,是在贝叶斯理论框架下,通过计算机进行模拟的蒙特卡洛方法。

       蒙特卡洛方法的实质是通过大量随机试验,利用概率论解决问题的一种数值方法。马尔科夫链是指生成随机数列的一种方法。

       MCMC是一种简单有效的计算方法,在很多领域到广泛的应用,如统计生物学、贝叶斯(Bayes)问题、计算机问题等。

         MCMC通过将随机生成的数值与之前的数值进行比较,通过检测是否与正确值更接近,来判断下一步是接受还是重新生成一个随机值,循环往复,最终找到最接近正确值的区域。STRmix将这个过程分为两个部分,pre-burn in 和post-burn in 分别计算10万次和5万次,最终找到正确的解释。

         MCMC结合STRmix的生物模型,具体的工作方式如下:

         目前STRmix的客户数量已经近100个,主要分布在北美、欧洲和大洋洲,成为目前最受欢迎的混合图谱分析系统。


 

 

下一篇: