自数学家首次注意到素数以来,2300年过去了,他们仍然对其着迷。

这让我们琢磨了千年。

3 月 20 日,美籍加拿大 数学家 罗伯特·朗兰兹(Robert Langlands)获得了阿贝尔奖,以表彰他在数学领域的终生成就。朗兰兹的研究表明,几何、代数和分析等概念可以通过与素数这一共同联系结合起来。

当挪威国王于 5 月向朗兰兹颁发奖项时,他将表彰一项长达 2300 年、旨在理解 素数 的努力,素数可以说是数学中最大、最古老的数据集。

作为一名致力于“朗兰兹纲领”的数学家,我着迷于素数的历史以及近期进展如何揭示它们的奥秘。为什么它们几千年来一直吸引着数学家?

如何找到素数

为了研究素数,数学家们将整数通过一个又一个虚拟的筛网过滤,直到只剩下素数。这种筛选过程在 19 世纪产生了数百万个素数的表格。它使当今的计算机能够在不到一秒钟的时间内 找到数十亿个素数。但筛法的核心思想在 2000 多年来从未改变。

“素数是只能被单位整除的数,” 数学家欧几里得在公元前 300 年写道。这意味着素数除了 1 之外,不能被任何更小的数整除。根据惯例,数学家不将 1 本身视为素数。

欧几里得证明了素数的无穷性——它们无穷无尽——但历史表明,是埃拉托斯特尼为我们提供了快速列出素数的筛法。

筛法的思路是这样的。首先,滤除 2 的倍数,然后是 3 的倍数,接着是 5 的倍数,再然后是 7 的倍数——这四个是前四个素数。如果你对 2 到 100 之间的所有数字都这样做,就只会剩下素数。

通过 GIPHY

通过八次筛选,可以分离出 400 以内的素数。通过 168 次筛选,可以分离出一百万以内的素数。这就是埃拉托斯特尼筛法的威力。

表格,表格

约翰·佩尔(John Pell)是 编排素数表 的早期人物之一,他是一位英国数学家,致力于创建有用的数字表格。他最初是为了解决丢番图的古老算术问题,但也出于个人整理数学真理的愿望。得益于他的努力,一百万以内的素数在 1700 年代初被广泛传播。到 1800 年,独立的项目已经编排了 100 万以内的素数表。

为了自动化繁琐的筛选步骤,一位名叫卡尔·弗里德里希·兴登堡(Carl Friedrich Hindenburg)的德国数学家使用了可调节的滑块,一次性在整页表格上划掉倍数。另一种低技术但有效的方法是使用模板来定位倍数。到 19 世纪中叶,数学家 雅各布·库里克(Jakob Kulik) 开始了一项雄心勃勃的项目,旨在找到 1 亿以内的所有素数。

stencil used to sieve multiples of 37
库里克用于筛除 37 的倍数的模板。AÖAW,Nachlass Kulik,图片由 Denis Roegel 提供,作者提供

19 世纪的这些“大数据”可能只充当参考表,如果 卡尔·弗里德里希·高斯(Carl Friedrich Gauss) 没有决定对素数本身进行分析的话。高斯拥有一个包含 300 万以内素数的列表,他开始一次计算一个“千位数”,或者说每 1000 个单位一组。他计算了 1000 以内的素数,然后是 1000 到 2000 之间的素数,然后是 2000 到 3000 之间的素数,等等。

高斯发现,随着他计算的数字越来越大,素数的频率按照“倒数对数”规律逐渐降低。高斯的规律并没有精确地显示有多少素数,但它给出了一个相当好的估计。例如,他的规律预测在 1,000,000 和 1,001,000 之间有 72 个素数。而 正确的计数是 75 个素数,误差大约为 4%。

在高斯首次探索一个世纪后,他的规律在 “素数定理” 中得到了证明。误差百分比在大范围的素数中越来越接近零。黎曼猜想,一个如今价值百万美元的奖项难题,也描述了高斯估计的准确性。

素数定理和黎曼猜想吸引了关注和资金,但它们都建立在早期、不那么光鲜的数据分析之上。

现代素数之谜

如今,我们的数据集来自计算机程序而不是手工模板,但数学家们仍在发现素数的新模式。

除了 2 和 5 之外,所有素数的个位数都是 1、3、7 或 9。在 19 世纪,人们证明了这些可能的个位数出现频率是均等的。换句话说,如果你查看一百万以内的素数,大约有 25% 的个位数是 1,25% 是 3,25% 是 7,25% 是 9。

Last digits of prime numbers
来源:Martin Weissman

几年前,斯坦福大学的数论学家 Lemke Oliver 和 Kannan Soundararajan 对素数个位数的奇特性感到惊讶。一项 实验 研究了素数的个位数,以及紧随其后的下一个素数的个位数。例如,23 的下一个素数是 29:它们的个位数分别是 3 和 9。在素数的个位数中,3 后面跟 9 的情况是否比 3 后面跟 7 的情况更常见?

frequency of last digit pairs infograph
一百万以内连续素数的最后一位数对的频率。匹配的颜色对应匹配的间隔。M.H. Weissman,CC BY

数论学家们预计会有一些变化,但他们发现的结果大大超出了预期。素数之间有不同的间隔;例如,23 和 29 相隔六个数字。但像 23 和 29 这样的 3-然后-9 素数比 7-然后-3 素数更常见,尽管它们都来自于六的间隔。

数学家们很快找到了一个 合理的解释。但是,在研究连续素数方面,数学家们(大多)仅限于数据分析和说服。而证明——数学家们衡量事物真伪的黄金标准——似乎还要几十年。

Martin H. Weissman 是加州大学圣克鲁兹分校的数学副教授。本文最初发表在 The Conversation 上。

The Conversation
 

更多优惠、评测和购买指南

 
© .