36年卷積猜想被解決，華人唯一作者，AI或受益_ai|數(shù)學(xué)|人工智能

文章圖片

文章圖片

文章圖片

機(jī)器之心報(bào)道
機(jī)器之心編輯部
一般來(lái)說(shuō) ，字越少事情越大。
數(shù)學(xué)領(lǐng)域的研究成果因其高門(mén)檻很少能獲得廣泛的關(guān)注，而這一篇卻足足達(dá)到了 80 萬(wàn)以上的瀏覽量。

這是一篇非常硬核的數(shù)學(xué)證明論文，來(lái)自華人學(xué)者 Yuansi Chen ，解決了至今已有 36 年的 Talagrand 卷積猜想的數(shù)學(xué)問(wèn)題，對(duì)于現(xiàn)代計(jì)算機(jī)科學(xué) ，機(jī)器學(xué)習(xí)等相關(guān)領(lǐng)域有深遠(yuǎn)的基礎(chǔ)意義。

Yuansi Chen ， ETH D-MATH 統(tǒng)計(jì)研討會(huì)副教授，杜克大學(xué)統(tǒng)計(jì)科學(xué)系助理教授。在蘇黎世 ETH 的 ETH 數(shù)據(jù)科學(xué)基?。 ‥TH-FDS）擔(dān)任博士后研究員。 2023 年獲得斯隆研究獎(jiǎng) 。他的研究方向聚焦于統(tǒng)計(jì)機(jī)器學(xué)習(xí)、MCMC 采樣算法、優(yōu)化方法、域適應(yīng)性以及計(jì)算神經(jīng)科學(xué)中的統(tǒng)計(jì)挑戰(zhàn) 。

論文標(biāo)題：Talagrand's convolution conjecture up to loglog via perturbed reverse heat 論文鏈接：https://arxiv.org/abs/2511.19374該論文證明了在布爾超立方體上的熱半群 (Pτ) 下，任何非負(fù)函數(shù) f:{?11 n→?+ 都表現(xiàn)出比馬爾可夫不等式更好的統(tǒng)一尾部界限。具體來(lái)說(shuō) ，對(duì)于任何 ηe3 和 τ0，

其中 μ 表示布爾超立方體 {?11? 上的均勻測(cè)度，而 c_τ 是僅依賴(lài)于 τ 的常數(shù) 。該結(jié)果在無(wú)維度依賴(lài)的情形下解決了 Talagrand 的卷積猜想，只額外損失一個(gè) log log η 因子。其證明依賴(lài)于布爾超立方體上反向熱過(guò)程的若干性質(zhì) ，并基于對(duì)該反向熱過(guò)程進(jìn)行精心設(shè)計(jì)的擾動(dòng)而構(gòu)造出的耦合方法。
也就是說(shuō) ，除了額外的 log log 因子外， Talagrand 卷積猜想的主要問(wèn)題已經(jīng)被解決。
Zhipeng Huang 也進(jìn)行了轉(zhuǎn)發(fā) ，他也在思考這一數(shù)學(xué)領(lǐng)域的進(jìn)展對(duì)大語(yǔ)言模型訓(xùn)練的潛在影響。

背景與問(wèn)題
Talagrand 卷積猜想于 1989 年首次提出，代表了概率論和泛函分析領(lǐng)域最重要的開(kāi)放問(wèn)題之一。該猜想關(guān)注熱半群應(yīng)用于布爾超立方體 {?1 1? 上的 L? 函數(shù)時(shí)的正則化性質(zhì) 。這種離散幾何結(jié)構(gòu)在理論計(jì)算機(jī)科學(xué)、離散數(shù)學(xué)和統(tǒng)計(jì)物理中都至關(guān)重要。
熱半群 (P?) 充當(dāng)一個(gè)「平滑」算子，通過(guò)與偏置硬幣測(cè)度進(jìn)行卷積來(lái)定義。對(duì)于布爾超立方體上的函數(shù) f ， P?f (x) 表示 f 在一個(gè)點(diǎn)的期望值，該點(diǎn)是通過(guò)以 (1?e??)/2 的概率獨(dú)立翻轉(zhuǎn) x 的每個(gè)坐標(biāo)而獲得的。雖然強(qiáng)大的超收縮性結(jié)果保證了對(duì) p1 的 L? 函數(shù)的強(qiáng)正則化，但 L? 函數(shù)的行為仍然是個(gè)謎。
Talagrand 猜想預(yù)測(cè) ，將此平滑算子應(yīng)用于任何 L? 函數(shù)會(huì)顯著改善尾部衰減 —— 具體來(lái)說(shuō) ，即概率 P (Pτf (X)η‖f‖?) 應(yīng)以 1/(η√log η) 的速度衰減，并且在所有維度 n 和函數(shù) f 上都一致。這種與維度無(wú)關(guān)的性質(zhì)將代表一種普遍的正則化效應(yīng) ，與問(wèn)題的復(fù)雜性無(wú)關(guān) 。在這項(xiàng)工作之前，尾部概率是否在 η → ∞ 時(shí)消失仍然是一個(gè)開(kāi)放問(wèn)題。
本文為 Talagrand 猜想建立了第一個(gè)與維度無(wú)關(guān)的上限，證明了：
定理 1：對(duì)于每個(gè) τ0 ，存在一個(gè)通用常數(shù) c0 ，使得對(duì)于每個(gè)非負(fù)函數(shù) f: {?1 1? → R? 且 ‖f‖? ≠ 0 ，以及任何 ηe3 ，

此結(jié)果解決了 Talagrand 關(guān)于

是否在 η → ∞ 時(shí)消失的基本問(wèn)題，提供了肯定的答案。雖然該界限比猜想的最優(yōu)速率 1/(η√log η) 多了一個(gè) log log η 因子，但它代表了對(duì)平凡馬爾可夫界限 1/η 的巨大改進(jìn) ，并使猜想的完全解決指日可待。
方法：擾動(dòng)反向熱過(guò)程
Yuansi Chen 的方法的技術(shù)核心在于通過(guò)他所謂的「擾動(dòng)逆熱過(guò)程」構(gòu)建了兩個(gè)馬爾可夫跳躍過(guò)程之間復(fù)雜的耦合。這種構(gòu)建代表了離散隨機(jī)分析中一項(xiàng)重大的方法學(xué)進(jìn)步。
該方法首先定義了前向和反向跳躍過(guò)程。前向過(guò)程 (U?) 始于定律 νf = f?μ ，其坐標(biāo)以 1/2 的速率獨(dú)立翻轉(zhuǎn) 。反向過(guò)程 (V?) 是 U? 的時(shí)間反演，它變?yōu)闀r(shí)間非均勻的，其跳躍速率取決于一個(gè)「得分函數(shù)」S?(x) := (x???f (x))/f (x) 。至關(guān)重要的是，這個(gè)得分函數(shù)充當(dāng)了高斯設(shè)置中福爾默漂移的離散模擬，并保持了基本的鞅性質(zhì) 。
核心創(chuàng)新在于構(gòu)建一個(gè)耦合 (V? W?) ，其中兩個(gè)過(guò)程共享相同的泊松隨機(jī)測(cè)度以實(shí)現(xiàn)最大相關(guān)性，但 W? 在其跳躍速率中引入了一個(gè)精心設(shè)計(jì)的擾動(dòng) 。與可以直接擾動(dòng)漂移的連續(xù)設(shè)置不同，離散設(shè)置需要通過(guò)狀態(tài)依賴(lài)和坐標(biāo)依賴(lài)的因子 δ?(x) 來(lái)擾動(dòng)跳躍速率。這種擾動(dòng)經(jīng)過(guò)校準(zhǔn) ，以確保 W? 保持在布爾超立方體上，同時(shí)實(shí)現(xiàn)所需的耦合性質(zhì) 。
技術(shù)上，證明結(jié)合了：
跳過(guò)程的鞅不等式類(lèi) Duhamel 展式 p - 偏置的 Fourier／Parseval 分析對(duì)梯度／得分的精細(xì)控制這些工具共同消除了此前方法中不可避免的維度依賴(lài)因素，使得在布爾超立方體上實(shí)現(xiàn)「無(wú)維度」控制成為可能。
在離散結(jié)構(gòu)中：
噪聲是跳躍型而非連續(xù) Gaussian OU 流對(duì)稱(chēng)性較弱稀有區(qū)域（rare regimes）中必須引入更強(qiáng)的擾動(dòng) 分布在奇異點(diǎn)附近缺乏連續(xù)高斯半群的光滑調(diào)和結(jié)構(gòu)因此當(dāng)前方法不可避免地留下一個(gè) loglog η 的殘差損失。
從連續(xù)空間到離散空間的適應(yīng)帶來(lái)了幾個(gè)根本性的挑戰(zhàn) ， Yuansi Chen 通過(guò)創(chuàng)新技術(shù)解決了這些挑戰(zhàn)：
跳躍速率與漂移擾動(dòng)：直接的漂移擾動(dòng)會(huì)將過(guò)程移出 {-1 1? ，因此需要開(kāi)發(fā)跳躍速率擾動(dòng)方法。這導(dǎo)致了更復(fù)雜的狀態(tài)依賴(lài)動(dòng)力學(xué) ，但保留了離散結(jié)構(gòu) 。 L? 距離問(wèn)題：在高斯空間中有效的標(biāo)準(zhǔn) L? 界在布爾超立方體上變得有問(wèn)題。耦合構(gòu)建專(zhuān)門(mén)設(shè)計(jì)為避免依賴(lài)此類(lèi)界，而是通過(guò)一種新穎的多階段方法利用總變差控制。多階段杜阿梅爾公式：一項(xiàng)關(guān)鍵創(chuàng)新涉及在多個(gè)時(shí)間間隔而不是單個(gè)階段應(yīng)用杜阿梅爾公式。這種多階段方法被證明對(duì)于通過(guò)有效利用 Pτ 隨時(shí)間的平滑性質(zhì)來(lái)獲得無(wú)維度界限至關(guān)重要。該證明建立了兩個(gè)關(guān)鍵的耦合性質(zhì)：V? 和 W? 律之間的總變差控制（引理 2），以及一個(gè)近似單調(diào)耦合性質(zhì) ，確保 log Pτf (W?) 的大值以高概率對(duì)應(yīng)于 log Pτf (V?) 的更大值（引理 3）。
總結(jié)
為布爾熱半群提供了幾乎最優(yōu)、無(wú)維度依賴(lài)的尾部正則化結(jié)果；引入了一種全新的「反向過(guò)程耦合」技術(shù) ，可應(yīng)用于離散隨機(jī)系統(tǒng)；提升了布爾函數(shù)反集中（anti-concentration）分析的工具箱；在離散采樣、組合結(jié)構(gòu)上的 score-based 生成模型等領(lǐng)域具有潛在外溢效應(yīng) 。這項(xiàng)工作代表了離散隨機(jī)分析領(lǐng)域的一項(xiàng)里程碑式成就，成功地將復(fù)雜的連續(xù)空間技術(shù)與離散概率相結(jié)合。該界限的無(wú)維度性質(zhì)對(duì)理論計(jì)算機(jī)科學(xué)具有直接影響，其中布爾超立方體在學(xué)習(xí)理論、復(fù)雜性理論和近似算法中作為基本結(jié)構(gòu) 。
也許最重要的是，這篇論文為徹底解決塔拉格朗猜想奠定了一條清晰的道路。剩余的 log log η 因子代表了未來(lái)研究的明確目標(biāo) 。作者指出，對(duì)耦合過(guò)程距離的更精細(xì) L? 界或替代擾動(dòng)設(shè)計(jì)可能會(huì)消除這個(gè)最終因子。
與機(jī)器學(xué)習(xí)中基于得分的生成模型的明確聯(lián)系表明了潛在的跨學(xué)科影響，其中來(lái)自離散得分函數(shù)和時(shí)間反演的見(jiàn)解可以為離散生成模型的理論基礎(chǔ)提供信息。
對(duì)于計(jì)算機(jī)科學(xué)家和 ML 研究員來(lái)說(shuō) ，這篇論文不僅僅是一個(gè)不等式的證明，它：
1. 升級(jí)了工具箱：提供了處理高維離散空間概率分布的新工具。
2. 連接了生成模型：其證明核心（反向熱流）與當(dāng)前的 AI 熱點(diǎn)（擴(kuò)散模型）在數(shù)學(xué)本質(zhì)上相通。
3. 量化了正則化：也就是為什么「平滑 / 加噪」總是能帶來(lái)「好」的分布性質(zhì) 。
該論文將一個(gè)數(shù)十年懸而未決的開(kāi)放問(wèn)題轉(zhuǎn)變?yōu)橐粋€(gè)擁有明確后續(xù)步驟的活躍領(lǐng)域，同時(shí)增進(jìn)了對(duì)離散結(jié)構(gòu)上正則化效應(yīng)的基本理解。這項(xiàng)工作既是一個(gè)重要的解決方案，引導(dǎo)未來(lái)深入探索連續(xù)和離散隨機(jī)分析之間豐富的相互作用。
【36年卷積猜想被解決，華人唯一作者，AI或受益】更多信息，請(qǐng)參閱原論文。

36年卷積猜想被解決，華人唯一作者，AI或受益

推薦閱讀

瓜田李下是什么意思瓜田李下是什么意思解釋

破壁機(jī)打不熟豆?jié){怎么回事-破壁機(jī)打豆?jié){沒(méi)熟怎么辦

心理健康手抄報(bào)內(nèi)容心理健康手抄報(bào)小學(xué)生

水燒開(kāi)了但是涼了還可以喝嗎

刷6.43出現(xiàn)錯(cuò)誤信息解決辦法

地線有電怎么回事

高中+中職 2022武漢中考錄取資格線

門(mén)過(guò)梁拆除后如何加固

一眼看穿：十招教您防范網(wǎng)絡(luò)欺詐

描寫(xiě)兔子的作文三年級(jí)【通用8篇】

vivo10手機(jī)，vivo 10手機(jī)有多大

三國(guó)殺現(xiàn)在銅幣什么時(shí)候不能換銀兩了,《三國(guó)殺十周年》資料片

我來(lái)分享vivox60人像構(gòu)圖怎樣開(kāi)啟

紅日東升指什么動(dòng)物

格林豪泰高鐵南站，杭州高鐵站到南山路146號(hào)一1格林豪泰酒店

6s和se的區(qū)別哪個(gè)好,買(mǎi)哪個(gè)比較好