白天打工，晚上科研，Google大腦研究科學家解決了困擾數學界幾十年的猜想-人工智慧-PHP中文網

什麼是並封閉集猜想？

不確定性的洞察

探索難題

失之東隅，收之桑榆

首頁

科技週邊

人工智慧

白天打工，晚上科研，Google大腦研究科學家解決了困擾數學界幾十年的猜想

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 am 09:49 AM

ai 數學

2022 年 10 月中旬，Justin Gilmer 從加州飛往紐約，在東海岸拜訪了他以前的導師 Michael Saks，一位羅格斯大學的數學家。

敘舊期間，他們並未談到數學。事實上，自從 2015 年在羅格斯大學獲得博士學位後，Gilmer 就再也沒認真思考過數學問題。那時候他決定不在學術界發展，同時開始自學程式設計。當他和 Saks 共同用餐時，Gilmer 向導師講述了他在谷歌的工作：機器學習和人工智慧。

在校園的小路上，Gilmer 邊走邊回憶，2013 年，他花了一年多的時間走在這條路上，思考一個叫做「並封閉集猜想（又稱Frankl猜想）」的問題。這一直是個沒有結果的難題。 Gilmer 所做的一切努力，只是成功地教會了自己，為什麼這個關於數字集合的看似簡單的問題會如此難以解決。

但在七年後的這次訪問後，Gilmer 突然有了全新的靈感。他開始思考如何應用資訊理論來解決並封閉集猜想。經過一個月的研究後，通往證明的路徑不斷打開。 11 月，他在 arXiv 上發布了研究結果，宣佈在證明整個猜想方面取得了重大進展。

白天打工，晚上科研，Google大腦研究科學家解決了困擾數學界幾十年的猜想

論文連結：https://arxiv.org/pdf/2211.09055.pdf

這篇論文掀起了後續研究的熱潮。牛津大學、麻省理工學院和高等研究院等機構的數學家們迅速在 Gilmer 的新方法基礎上工作。

什麼是並封閉集猜想？

並封閉集合猜想與數的集合相關，如 {1，2} 和 {2，3，4}。你可以對集合進行運算，包括取它們的並集，也就是合併它們。例如，{1，2} 和 {2，3，4} 的並集是 {1，2，3，4}。

如果該族中任何兩個集合的並集等於族中任何現有的集合，這個集合或族被認為是「並集封閉」的。例如，考慮這個由四個集合組成的族：{1}, {1, 2}, {2, 3, 4}, {1, 2, 3, 4}。

將任何一對組合起來，你就會得到一個已經在族中存在的集合，所以說這個族是並封閉集的。

數學家們早在20 世紀60 年代就討論過並封閉集猜想，但直到1979 年它才得到了第一次正式陳述，是在Péter Frankl 的一篇論文中，他是一位匈牙利數學家，80 年代移民到日本，除了數學還熱愛街頭表演。

Frankl 猜想，如果一個集合的族是並封閉集合的，那麼它必須至少有一個元素（或數字）出現在至少一半的集合中。這是一個自然存在的閾值，原因有二。

白天打工，晚上科研，Google大腦研究科學家解決了困擾數學界幾十年的猜想

Justin Gilmer

首先，在現成的並封閉集族的例子中，其中所有元素正好出現在50% 的集合中。比方說，你可以用數字 1 到 10 組成所有不同的集合，總共會有 1024 個這樣的集合。它們構成了一個並封閉集族，10 個元素中的每一個都出現在其中的 512 個集合。

在 Frankl 提出這個猜想的時候，還沒有人提出過一個猜想不成立的並且封閉集族的例子。所以 50% 似乎是正確的預測。

這並不意味著它很容易被證明。在 Gilmer 的工作之前，許多論文只能設法建立了隨族中集合數量變化的閾值（而不是對所有大小的集合族都是相同的 50% 閾值）。

哥倫比亞大學的 Will Sawin 說：「感覺它應該很容易，而且它與許多容易的問題相似，但它一直未被攻克。」

缺乏進展既反映了這個問題的棘手性質，也反映了許多數學家寧願不去想它。他們擔心自己會浪費多年的職業生涯，追逐一個不可能解決的問題。 Gilmer 記得 2013 年的某一天，他去 Saks 的辦公室提到這個並封閉集猜想，這些也曾經與這個問題搏鬥過的導師把他趕出了房間。

不確定性的洞察

在訪問羅格斯大學之後，Gilmer 的腦海中滾動著這個問題，試圖理解為什麼它是如此困難。他用一個基本事實提示自己：如果你有一個由 100 個集組合組成的族，有 4950 種不同的方式來選擇二者並將他們結合起來。然後他想：如果沒有任何元素至少以某種頻率出現在這些結合中，那麼 4950 種不同的結合又怎麼可能映射到 100 個集合呢？

在這一點上，他已經在通往解決的路上了，儘管他還不自知。

資訊理論在 20 世紀上半葉發展，其中最著名的是 Claude Shannon 1948 年的論文《通訊的數學理論》。這篇論文提供了一種精確的方法來計算發送訊息所需的資訊量，基於圍繞著訊息表達內容的不確定性的大小。這種資訊和不確定性之間的關聯，正是香農的卓越見解。

資訊理論經常出現在組合學中，這是一個與計數物件有關的數學領域，這也是 Gilmer 在研究生時期研究的內容。但當他飛回加州的家中時，他還擔心將資訊理論與並封閉集猜想聯繫起來的方式是一個業餘者的天真見解。

「說實話，我有點驚訝之前沒有人想到這個，」Gilmer 表示。「但也許我不應該感到驚訝，因為我自己也想了一年，而且我是懂信息理論的。」

探索難題

##Gilmer 對數學的鑽研來自於自己對數學的熱愛。他平日主要忙於谷歌的日常工作，閒暇時間就潛心研究數學問題。上班時他也帶著一本數學教科書，以便隨時找出忘記的公式。 Gilmer 腳踏實地，也仰望星空 —— 他喜歡看著名數學家 Tim Gowers 的博客，這會讓他備受鼓舞。

Gilmer 謙虛地說：「也許你認為解決數學難題的人不應該查閱《Elements of Information Theory（資訊理論基礎）》第2 章，但我查閱了。」

Gilmer 提出的方法是設想一個並封閉集族，其中任何元素在所有集合中出現的機率都小於1%。這是一個反例，如果它真的存在，將證偽 Frankl 的猜想。

假設從這個族中隨機選擇兩個集合 A 和 B，問：集合 A 包含數字 1 的機率是多少？集合 B 呢？由於每個元素出現在任何給定集合中的機率略低於 1%，因此不應期望 A 或 B 包含 1。這意味著如果兩者實際上都不包含 1，我們不會感到驚訝，當然也不會獲得任何資訊。

接下來，考慮 A 和 B 的並集包含 1 的機率。這仍然不太可能，但比1 出現在任何一個單獨集合中的機率大一些，是1 出現在A 中的機率與1 出現在B 中的機率總和減去1 同時出現在兩者中的機率。所以 A 和 B 的並集包含 1 的機率約低於 2%。

這仍然很低，但更接近 50% 的猜想，這意味著需要更多資訊才能共享結果。換句話說，如果存在一個並封閉集族，其中任何元素在所有集合中出現的機率都小於 1%，則兩個集合的並集比任何一個集合本身包含的資訊要多。

「逐個元素證明猜想的思路非常聰明」，普林斯頓大學的 Ryan Alweiss 評論道。

Gilmer 的工作開始接近 Frankl 的猜想。這是因為很容易證明：在並封閉集族中，兩個集合的並集包含的資訊必然少於兩個集合本身 —— 而不是更多。

原因很簡單，以包含 1024 個不同集合的並封閉集族為例，每個集合中元素是 1 到 10 的數字。如果隨機選擇其中兩個集合，平均會得到包含五個元素的並集。（在這 1024 個集合中，有 252 個包含五個元素，這是最常見的集合大小。）也有可能我們會得到一個包含大約七個元素的並集。但是只有 120 種不同的組合方法能得到包含七個元素的並集。

關鍵是，兩個隨機選擇的集合包含的元素比其並集具有更多的不確定性。並集更像是具備更多元素、可能性較少的更大集合。當你在一個並封閉集族中對兩個集合進行並集操作時，你可能會知道合併結果，就像是拋出一個有偏重的硬幣，你很容易猜到硬幣落向哪面，並集包含的資訊少於兩個集合本身的資訊。

基於此，Gilmer 認為至少要有一個元素在集合中出現的機率大於等於 1%。

失之東隅，收之桑榆

當Gilmer 在11 月16 日發布他的證明時，他附上了一條說明—— 他認為使用他的方法可能更接近完整猜想的證明，有可能將閾值提高到38%。

五天后，三個不同的數學家團體在幾個小時內相繼發表了論文，他們在 Gilmer 的工作基礎上做到了這一點。這場爆發似乎已經將 Gilmer 的方法發揮到了極致，不過要達到 50%，可能需要更多的新想法。

不過，對於後續論文的一些作者來說，他們想知道為什麼 Gilmer 不自己做完相對簡單的達到 38% 的研究。事實上，原因並不複雜：在脫離數學超過 5 年後，Gilmer 只是不知道如何進行技術分析工作來實現這一目標。

「我有點生疏，老實說，我被困住了，」Gilmer 說。「但我很想知道數學社群會把它帶到哪裡。」

但Gilmer 也認為，使他失去實踐機會的同一原因，在某種程度上也使他的證明首先成為了可能：「這是唯一的解釋—— 為什麼我在研究生院想了一年這個問題毫無進展，離開數學六年之後再回到這個問題上卻取得了突破。除了機器學習讓我的想法產生變化之外，我不知道還有什麼解釋。」

以上是白天打工，晚上科研，Google大腦研究科學家解決了困擾數學界幾十年的猜想的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1666

CakePHP 教程

1425

Laravel 教程

1327

PHP教程

1273

C# 教程

1252

Related knowledge

C 中的chrono庫如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔，讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分，它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說，chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性，還提供了更高的精度和靈活性。讓我們從基礎開始，chrono庫主要包括以下幾個關鍵組件：std::chrono::system_clock：表示系統時鐘，用於獲取當前時間。 std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接內存訪問技術，允許硬件設備直接與內存進行數據傳輸，不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序，實現方式因係統而異。 2)直接訪問內存可能帶來安全風險，需確保代碼的正確性和安全性。 3)DMA可提高性能，但使用不當可能導致系統性能下降。通過實踐和學習，可以掌握DMA的使用技巧，在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C 中處理高DPI顯示？ Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現：1)理解DPI和縮放，使用操作系統API獲取DPI信息並調整圖形輸出；2)處理跨平台兼容性，使用如SDL或Qt的跨平台圖形庫；3)進行性能優化，通過緩存、硬件加速和動態調整細節級別來提升性能；4)解決常見問題，如模糊文本和界面元素過小，通過正確應用DPI縮放來解決。

C 中的實時操作系統編程是什麼？ Apr 28, 2025 pm 10:15 PM

C 在實時操作系統（RTOS）編程中表現出色，提供了高效的執行效率和精確的時間管理。 1）C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2）利用面向對象特性，C 可以設計靈活的任務調度系統。 3）C 支持高效的中斷處理，但需避免動態內存分配和異常處理以保證實時性。 4）模板編程和內聯函數有助於性能優化。 5）實際應用中，C 可用於實現高效的日誌系統。

給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時，需指定位置以優化查詢性能和數據結構；刪除字段前需確認操作不可逆；使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

怎樣在C 中測量線程性能？ Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析，步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析，步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能，並優化代碼。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括：1. Binance（幣安）：提供Binance Futures量化模塊，低手續費，支持AI輔助交易。 2. OKX（歐易）：支持多賬戶管理和智能訂單路由，提供機構級風控。獨立量化策略平台有：3. 3Commas：拖拽式策略生成器，適用於多平台對沖套利。 4. Quadency：專業級算法策略庫，支持自定義風險閾值。 5. Pionex：內置16 預設策略，低交易手續費。垂直領域工具包括：6. Cryptohopper：雲端量化平台，支持150 技術指標。 7. Bitsgap：