我是如何开始从事科学事业的

 

纯属偶然。在我学习的第一年,六个月后,我的导师弗拉基米尔·施丘尔(Vladimir Shchur)邀请我加入国际统计与计算基因组学实验室。他给我出了一个题,我解决了——难度不大。我发现基因组学这个主题很有趣,于是决定继续深造。

我一直以来对生物学都不太感兴趣,但当我发现可以用数学模型来计算、研究,并得出理论结果时,我感到很兴奋,也意识到这其实挺有趣的。

 

用生物学 我是如何 术语来说它

 

是由一系列有机化合物(核苷酸)组成的大分子。在这个序列中,每个单元可以是四个字母中的一个:A、T、C 或 G。整个人类基因组由三十亿个字母组成。处理它充满挑战,但科学家们已经找到了压缩数据的方法。他们生成了一个与普通人尽可能相似的序列,并强调了共同点。每个新个体的数据都会与该参考序列进行比较,只检查基因组中存在差异的部分。

如果将共同区域编码为零,将突变编码为一,计算机就可以使用此信息来计算特定模型,例如家谱。

照片:Evgenia Bashkardina / HSE 大学
我的研究主题
在我的整个工作中,我一直在做本质上 WhatsApp数据 相同的任务,只是形式不同。总的来说,它可以被描述为基于现代人类基因数据进行人口历史研究。

我一直在开发几种方法,基于基因数据估算大约400年前人类的迁徙参数。其中一种方法有助于了解最近两次迁徙的更多细节,而另一种方法则可以揭示这次迁徙持续了多少代。

第一种方法名为 LaNeta,非常简单。假设我 知道在给定的时间段内他们应该期望多少销售额 们有两个基因上截然不同的种群。大约 500 年前,发生了一次迁徙,第一个种群中的一些个体逃往第二个种群,此后两个种群继续彼此隔离地生活。在混合种群的第一代中,两个原始种群的基因组差异很大。然而,在连续的几代中,个体开始相互融合,结果,它们的基因组形成了由来自不同来源的片段组成的马赛克。我们的方法分析了这些片段在整个基因组中的分布随机性。

第二种方法QUAP基于类似的概念

 

但它不是检查基因组片段之间的相关性,而是使用基因组中的统计参数,例如方差和平均值。这些参数也会随时间变化,有助于确定混合发生的程度。

第二种方法比第一种方法具有更大的应用潜力,因为它基于几乎所有遗传学研究中常用的统计数据。然而,第一种方法更准确,因为它使用了更具信息量的统计数据,尽管它需 印度手机号码 要更大的样本量和更高的计算能力。

我学习的是哪个数学分支
概率论。高中的时候,我并不喜欢概率论。我和同学都觉得它不是数学,只是一种推测。然而,从那时起,我的看法发生了很大的变化。我开始认真学习概率论,并意识到它确实是数学,有公理、定理、证明——而且全都行得通。如今,知道有些对数学不太热衷的人并不认为它是一个严肃的学科,这让我更加欣赏概率论。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部