CT理论与应用研究

前景远大!科学家使用机器学习模型加速理论物 

来源:CT理论与应用研究 【在线投稿】 栏目:综合新闻 时间:2020-10-08

粒子物理学的标准模型描述了所有已知的基本粒子和支配宇宙的四种基本力中的三种;除了重力。

电磁、强、弱这三种力支配着粒子的形成、相互作用和衰变。

然而,在这个框架内研究粒子和核物理是困难的,并且依赖于大规模的数值研究。

例如,强力的许多方面需要在质子大小的十分之一到百分之一的尺度上数值模拟动力学,以回答有关质子、中子和原子核性质的基本问题。

物理助理教授Phiala Shanahan说:“最终,我们在使用晶格场理论研究质子和核结构方面受到了计算限制。”

“我们知道原则上如何解决很多有趣的问题,但我们就是没有足够的计算能力,尽管我们使用的是世界上最大的超级计算机。”

为了突破这些限制,Shanahan领导了一个将理论物理学与机器学习模型结合起来的小组。

在他们本月发表在《物理评论快报》上的论文《格点规范理论的等变流采样》中,他们展示了如何将物理理论的对称性融入机器学习和人工智能架构中,从而为理论物理提供更快的算法。

“我们使用机器学习不是为了分析大量的数据,而是在不损害方法的严密性的情况下加速第一原理,”Shanahan说。

“这项特殊的工作表明,我们可以利用内置的粒子和核物理标准模型的对称性来构建机器学习架构,并将我们的目标采样问题加速几个数量级。”

这个月的论文是一系列旨在使目前难以计算的理论物理研究成为可能的论文中的一篇。

“我们的目标是为理论物理学中数值计算的一个关键组成部分开发新的算法,”Kanwar说。

“这些计算让我们了解了粒子物理标准模型的内部工作原理,粒子物理是我们最基本的物质理论。这样的计算对于比较粒子物理实验的结果至关重要,比如欧洲核子研究中心的大型强子对撞机,既可以更精确地限制模型,也可以发现模型在哪里失效,还必须扩展到一些更基本的东西。”

在非摄动状态下研究粒子物理标准模型的唯一已知的系统可控方法是基于真空中量子涨落的快照采样。通过测量这些涨落的性质,可以推断出所感兴趣的粒子和碰撞的性质。

Kanwar解释说,这项技术带来了挑战。

他说:“这种抽样很昂贵,我们希望利用受物理启发的机器学习技术来更有效地抽取样本。”

机器学习在图像生成方面已经取得了巨大的进步,比如,英伟达(NVIDIA)最近的一项工作就是通过神经网络生成“想象出来的”人脸图像。

“把这些真空的快照看作是图像,我们认为使用类似的方法来解决我们的问题是很自然的。”

特别值得一提的是,该小组引入了一个框架,用于构建完全尊重一类对称性的机器学习模型,该模型被称为“规范对称性”(gauge symmetries),这对研究高能物理至关重要。

作为原理的证明,Shanahan和他的同事们使用他们的框架来训练机器学习模型来模拟一个二维的理论,结果是比最先进的技术提高了数量级的效率,并且从理论中得到了更精确的预测。

这为使用基于物理的机器学习显著加快对自然基本力量的研究铺平了道路。

“我认为,在过去的一年里,我们已经表明,将物理知识与机器学习技术相结合有很大的前景,”Kanwar说。

“我们正在积极思考如何解决使用我们的方法进行全尺寸模拟的剩余障碍。我希望在未来几年内看到这些方法第一次大规模应用于计算。”

这个基于物理的机器学习理念也被团队称为“ab-initio AI”,这是最近在麻省理工学院成立的国家科学基金会人工智能和基本相互作用研究所(IAIFI)的一个关键主题,Shanahan是该研究所的物理理论研究协调员。

编译/前瞻经济学人APP资讯组

原文来源:

上一篇:【学术动态】李玮:全球价值链理论和发展中国家
下一篇:没有了