AlphaGo勝局十年后:AI正在重塑職業棋手的思維方式

AlphaGo勝局十年后:AI正在重塑職業棋手的思維方式

文章圖片

AlphaGo勝局十年后:AI正在重塑職業棋手的思維方式

文章圖片


(來源:麻省理工科技評論)

在首爾東部寧靜的弘益洞小巷深處 , 有一棟貼著褪色石磚的建筑 , 門牌上寫著“韓國棋院\"——這是韓國職業圍棋的管理機構 。

圍棋是一項古老的運動 , 在韓國有著神圣的地位 。 然而走進這棟樓 , 昔日棋手將手伸入木碗取子時發出的細微聲響 , 如今已被鼠標點擊聲所取代:棋手們弓身坐在顯示器前 , 在 AI 程序中復盤對局;另一些人圍坐在棋盤旁 , 爭論下一步最優落點 , 而教練則告知他們的選擇與 AI 的建議相差多少;還有人默默坐著 , 看 AI 程序與 AI 程序對弈 。

十年前 , Google DeepMind 的 AI 程序 AlphaGo 擊敗韓國棋手李世石(Lee Sedol) , 震驚世界 。 此后數年 , AI 徹底顛覆了這項運動 , 推翻了數百年來關于最優落子的原則 , 并引入了全新的思路 。 棋手們如今訓練的目標 , 是盡可能地復制 AI 的落子 , 而非創造自己的風格 , 哪怕他們對機器的思維邏輯仍感到茫然 。

今天 , 不借助 AI , 棋手幾乎不可能在職業舞臺上立足 。 有人說這項技術耗盡了圍棋的創造力 , 也有人認為人類的創造空間依然存在;與此同時 , AI 正在推動訓練資源的民主化 , 越來越多的女棋手因此得以躋身高段行列 。

對于世界頂尖棋手申真谞(Shin Jin-seo)而言 , AI 是一位不可或缺的訓練伙伴 。 每天清晨 , 他坐在電腦前打開 KataGo 。 他因落子風格與 AI 高度契合而被冠以“申真智能”的外號 , 他追蹤那個代表程序最優建議的藍色光點 , 在數字棋盤上不斷調整棋子位置 , 試圖理解機器的思考邏輯 。 “我一直在思考 AI 為什么會選擇這步棋 , ”他說 。

備戰對局時 , 申真谞將大部分清醒時間都花在研讀 KataGo 上 。 “這幾乎像一種修行 , ”他說 。 2022 年韓國棋院聯賽的一項研究顯示 , 申真谞的落子與 AI 建議的吻合度達 37.5% , 遠高于研究中所有棋手的平均水平 28.5% 。

“我的棋風變了很多 , ”申真谞說 , “因為我必須在一定程度上遵從 AI 的指引 。 ”韓國棋院表示 , 已主動聯系 Google DeepMind , 希望促成申真谞與 AlphaGo 之間的對局 , 以紀念 AlphaGo 擊敗李世石十周年 。 Google DeepMind 發言人表示 , 公司目前暫無相關信息可以披露 。 但若新的對局成真 , 在更先進 AI 程序上磨礪多年的申真谞對獲勝持樂觀態度 。 “AlphaGo 當時仍有一些弱點 , 我認為針對這些弱點可以擊敗它 , ”他說 。


規則

圍棋是一種抽象策略棋類游戲 , 起源于 2500 多年前的中國 。 兩位棋手輪流在 19×19 的棋盤上落下黑白棋子 , 通過包圍對手的棋子來占領領地 。 這是一場令人嘆為觀止的數學復雜游戲 。 棋盤可能的局面數約為 10 的 170 次方 , 遠超宇宙中的原子數量 。 如果說國際象棋是一場戰斗 , 圍棋便是一場戰爭:你在一角窒息對手的同時 , 還要在另一角抵御入侵 。
【AlphaGo勝局十年后:AI正在重塑職業棋手的思維方式】
為訓練 AI 下圍棋 , 海量人類棋局數據被輸入模擬人腦神經元網絡的計算系統神經網絡 。 AlphaGo 在擊敗李世石后被命名為 AlphaGo Lee , 訓練數據包含 3000 萬步棋局 , 并通過與自身進行數百萬次對弈加以精進 。 2017 年 , 其繼任者 AlphaGo Zero 從零開始學習圍棋 , 不研究任何人類棋局 , 僅依據規則與自身對弈 , 純靠自我博弈發展出落子策略 。 這種白板式學習方式不受人類知識局限 , 被證明更為強大 。 訓練三天后 , AlphaGo Zero 以 100 比 0 完勝 AlphaGo Lee 。

Google DeepMind 同年宣布 AlphaGo 退役 。 隨后 , 一批受 AlphaGo Zero 啟發的開源模型相繼涌現 。 今天 , KataGo 是韓國職業圍棋棋手使用最為廣泛的程序 。 它比 AlphaGo 更快、更精準 , 不僅能預測勝負 , 還能在任意時刻預測棋盤每個點位的歸屬 。 AlphaGo Zero 通過分析棋盤的局部小塊來拼湊出對整體的理解 , 而 KataGo 則學會了讀懂整張棋盤 , 對長遠戰略形成了更強的判斷力 。 它不僅學會了如何贏棋 , 更學會了如何最大化得分 。

這款軟件從根本上改變了人們的下棋方式 。 數百年來 , 職業棋手應對圍棋天文數字般復雜局面的方式 , 是發展出一套替代純粹計算的啟發式原則:精妙的布局策略為空白棋盤建立抽象秩序 , 早早搶占角落被視為劃不來的交換 , 每一代棋手都在積累新的原則 , 充實這門學問的體系 。

然而 , “AI 改變了一切 , ”韓國圍棋解說員樸正相(Park Jeong-sang)說 , “曾經被視為常識的基本下法如今幾乎銷聲匿跡 , 而過去從未有過的技術則大行其道 。 ”

變化最為顯著的是布局 。 圍棋從空白棋盤開始 , 前 50 手曾是抽象思考與創造力的畫布 , 棋手在其中刻下各自的個性與棋道哲學 。 李世石以充滿挑釁的落子風格著稱 , 擅長制造混亂;曾在 2017 年負于 AlphaGo Master 的中國棋手柯潔 , 則以靈動想象力令人眼花繚亂 。 如今 , 棋手們記憶的是同一套由 AI 建議的高效、精算型布局套路 。 棋局的重心已轉移到中盤 , 在那里 , 純粹的計算能力比創造力更為重要 。

AI 訓練導致了棋風的同質化 。 柯潔曾感嘆 , 看著同樣的布局套路被無休止地重復 , 令人疲憊 。 “我和場下的觀眾感受完全一樣 , 看著很累 , 很痛苦 , ”他 2021 年在接受中國媒體采訪時說 。 每當有棋手突破慣例、落出出人意料的棋 , 觀眾便歡呼雀躍 , 但這樣的時刻已越來越少 。 2023 年的一項研究顯示 , 頂尖圍棋棋手超過三分之一的落子與 AI 建議相同 。 許多棋手表示 , 每局棋的前 50 手往往與 AI 的建議如出一轍 。

“圍棋已經變成了一項智力競技運動 , ”在 2016 年負于 AlphaGo 三年后退役的李世石說 , “在 AI 出現之前 , 我們追求的是更高的東西 。 我是把圍棋當作一門藝術來學的 , ”他說 , “但如果你的落子來自抄答案 , 那就不再是藝術了 。 ”

一些棋手說 , 下圍棋不再是開拓新領域 , 而是遵從一個超人神諭的指令 。 “我曾經通過推動圍棋技術的進步、呈現新的范式來激勵棋迷 , ”李世石說 , “我下棋的理由已經消失了 。 ”


棋思

留守賽場的棋手們正在嘗試重建自己的技藝 , 但很難辨清新的原則究竟是什么 。

金彩瑛(Kim Chae-young)是世界頂尖女棋手之一 , 恬靜沉穩 , 從職業棋手父親那里習得了這門技藝 。 然而當 AI 開始重塑圍棋 , 她發現自己不得不從頭來過 。 “我需要時間去拋棄自己以前學到的一切 , ”金彩瑛在與我共享屏幕、用光標指著 KataGo 建議的藍色點位時說 , “多年來積累的直覺 , 原來是錯的 。 ”

她湊近顯示器 , 屏幕上顯示著每一步棋的勝率 , 沒有任何解釋 。 即便是金彩瑛、申真谞這樣的頂尖棋手 , 也無法理解 AI 的所有落子 。 “它好像是在用更高維度的方式思考 , ”她說 。 當她試圖向 AI 學習時 , 她補充道 , “與其說是理性地推敲每一步棋 , 不如說是在培養一種直覺 。 ”

研究人員正努力破譯棋類 AI 程序中編碼的超人知識 , 以便人類也能從中學習 。 2024 年 , Google DeepMind 的研究人員從 AlphaZero(AlphaGo Zero 的通用版本 , 同樣能夠下國際象棋)中提取出新的象棋概念 , 并通過象棋題將其傳授給國際象棋大師 。 棋手們迄今從 AI 系統中汲取的圍棋概念 , “很可能只是你潛在可以學到的一小部分 , ”豐田工業大學芝加哥分校計算機科學家尼古拉斯·托姆林(Nicholas Tomlin)說 , 他是一項探究 AlphaGo Zero 中圍棋概念編碼的研究的共同作者 。

然而提取這些經驗依然困難重重 。 “頂尖棋手至今仍未能歸納出 AI 落子背后的一般性原則 , ”明知大學圍棋教授南志賢(Nam Chi-hyung)說 。 盡管棋手可以模仿 AI 的落子 , 但由于其推理過程如同黑箱 , 他們尚未從中提煉出圍棋新的范式 。 圍棋或許正處于一種認識論上的迷途之中 。

即便 AI 是一位深不可測的導師 , 它也是一位公平的導師 。 AI 極大地提升了女棋手的訓練條件 , 而這一群體長期以來在圍棋界處于弱勢地位 。 南志賢表示 , 數十年來 , 圍棋訓練意味著在頂尖男棋手門下學藝 , 最具競爭力的對局也集中在女棋手難以涉足的男性圈子里 。 “女棋手從未有過那樣的歷練機會 , ”她說 , “但現在她們可以跟 AI 學習 , 訓練環境大為改善 。 ”從更宏觀的角度來看 , AI 通過幫助所有棋手打磨布局套路 , 縮小了棋手之間的差距 。

近年來 , 女棋手的排名持續攀升 。 2022 年 , 時任世界女子第一人的崔精(Choi Jeong)成為首位晉級國際大賽決賽的女棋手 。 她以兇悍好斗的棋風被稱為“女子力士” , 在決賽中迎戰申真谞 , 最終落敗 , 但這場對決為圍棋界女棋手開創了先例 。 2024 年 , 金彩瑛因在韓國圍棋聯賽后季賽奪冠而登上新聞頭條 , 她是那屆賽事中唯一的女棋手 。

AI 訓練賦予了金彩瑛全新的自信 。 用 AI 分析男棋手的對局 , 打破了他們看似無懈可擊的光環 。 “以前 , 我無法判斷頂尖男棋手的實力究竟有多強 , 他們感覺無堅不摧 。 現在 , 我知道他們也會犯錯 , 他們的落子并非總是妙手 , ”她說 , “AI 打破了心理上的壁壘 。 ”


身份

盡管 AI 在圍棋上的造詣已遠超任何棋手 , 棋迷們依然更愿意觀看人與人之間的對局 。 “AI 程序之間的對弈 , 對棋迷來說并不好看 , ”解說員樸正相說 , 這類對局過于復雜 , 棋迷難以跟上 , 而且太過完美 , 缺乏緊張感 。

棋手可以復制 AI 的布局套路 , 但到了中盤 , 棋盤演變出多到無法全部記憶的可能性 , 便需要依靠自己的判斷 。 棋迷樂于看到棋手犯錯、逆境翻盤 , 在棋盤上每一顆棋子里流露個性 。 申真谞的棋風強硬好斗 , 卻帶著一種機械般的沉著;金彩瑛則善于在最混亂的局面中游刃有余 。

“圍棋里 , 每一步都是你自己的選擇 , 對手也用自己的選擇來回應 , ”27 歲的圍棋愛好者和業余棋手金大熙(Kim Dae-hui)說 , “看著這個過程展開 , 很有意思 。 ”

有金大熙這樣的棋迷在看 , 申真谞從自己的棋局中找到了意義 。 “我能下出一種只有人類才能講述的故事 , ”他說 。

退役后 , 李世石尋找一份能發揮人類優勢的新工作 , 開始制作桌游、巡回演講 , 并在大學教學生下棋 。 “我在尋找一個我能享受、能擅長的新領域 , ”他說 。

然而近來 , 他對自己離開的那項運動重燃了希望 。 “下出一局完美棋局 , 是每一位圍棋棋手的夢想 , ”那是一局技藝精湛、沒有失誤、勢均力敵的棋手廝殺至刀刃邊緣的對局 。 “這就像一個海市蜃樓 , ”李世石笑著說 , “也許 AI 能幫我們下出那樣一局完美的棋 。 ”

申真谞希望自己能做到這一點 。 對申真谞來說 , AI 是老師、是伙伴、也是引路的北極星 。 “我或許是當今最強的人類棋手之一 , 但有 AI 在 , 我不能自滿 , ”他說 , “AI 給了我繼續進步的理由 。 ”

原文鏈接:
https://www.technologyreview.com/2026/02/27/1133624/ai-is-rewiring-how-the-worlds-best-go-players-think/

    推薦閱讀