每日經濟新聞 2025-04-18 14:07:47
北京大學北京國際數學研究中心教授董彬接受專訪,探討AI輔助數學研究的進展。董彬表示,正尋找解開數學研究隱藏密碼的“萬能鑰匙”,預計今明兩年部分數學猜想或將在AI輔助下完成。董彬認為,數學不會因AI發展走到盡頭,學生學數學重在培養邏輯思維與推理能力,這些能力在未來仍至關重要。
每經記者 丁舟洋 畢媛媛 每經編輯 楊夏
在北京大學數學學院籃球場,曾有司職小前鋒的球員,上籃愛用“數學思維”規劃最佳路徑。他是昔日學生隊隊長董彬,也是如今回歸北京大學的“80后”數學家。
董彬現任北京大學北京國際數學研究中心教授,兼任北京大學機器學習研究中心副主任,國家生物醫學影像中心、大數據分析與應用國家工程實驗室研究員,北京中關村學院常務副院長,用數學縱橫應用領域是他的興趣與擅長。他和團隊針對腫瘤診療問題研發系列新的定量和定性分析算法和工具,在三甲醫院推廣,部分成果已轉化。
近日,《每日經濟新聞》記者專訪董彬,探討他在AI輔助數學研究的最新進展。董彬表示,正在尋找一把“萬能鑰匙”,解開數學研究中的隱藏密碼。
數學的每一步跨越都在重塑人類文明演進的底層代碼。正如黎曼幾何奠定廣義相對論基礎,進而催生全球導航系統、天體觀測技術、航天軌道設計??大量未驗證的數學猜想吸引著全球數學家攀登,而如果它們能被AI(人工智能)自主破解,這場認知革命的意義遠超技術突破本身。
“我預測,在全球范圍內,今年或明年就會有一些數學猜想,在AI的輔助下完成,甚至由AI獨立完成。”董彬說,這也正是他主導的AI for Mathematics(簡稱AI4M)致力于突破的方向。在這場中美激烈角逐的全球數學智能競賽中,董彬團隊正以中國方案沖擊AI數學推理的“無人區”。
董彬所設想的未來充滿挑戰,來自事情本身,也來自人。
“2023年我剛開始做時,很多人都覺得我在talking crazy(說瘋話)。”在他看來,若是“學界大佬們”看后斷言此事為天方夜譚,他反倒覺得值得全力以赴。“哪怕會撞到南墻,也要自己撞上去,看看到底是一面石頭做的墻,還是紙糊的墻?而我內心堅信此事可行。”
“新基石研究員項目”是一項聚焦原始創新、鼓勵自由探索、公益屬性的新型基礎研究資助項目。2022年,騰訊公司宣布10年內出資100億元人民幣,支持富有創造力的科學家開展探索性與風險性強的基礎研究,實現“從0到1”的原始創新。董彬入選了第二期“新基石研究員”。
NBD:您本碩博都學數學專業,后來轉向機器學習和人工智能(AI),投身AI4M,為何有這樣的轉變?
董彬:從讀博起,我就參與生物醫學影像和多個醫學成像與圖像分析項目。2014年回到北大后,繼續從事圖像重建、處理,以及基于圖像的診斷與輔助治療等工作。期間深度學習快速發展,從起步到爆發,再到基礎模型出現,讓我思考:借助強大的AI工具,是否突破計算成像領域瓶頸,實現范式革新。
基礎模型能統一處理不同任務、挖掘潛在關聯,受此啟發,我想探索構建統一的計算成像模型或算法。經研究發現,各種成像方法在基本原理上,都可歸結為波與物質的相互作用。而想打通不同成像模態,關鍵在于構建基于微分方程求解的基礎模型,這也是我在新基石項目中聚焦解決的核心問題之一。
NBD:一把解所有微積分的“萬能鑰匙”會帶來什么?
董彬:若能構建為各類微分方程提供初始解的模型,其影響將遠超出計算成像領域。于是我們著手研究偏微分方程(PDE)基礎模型。有了一維模型雛形后,我發現工業仿真、制造業等諸多領域在實際中都面臨相似難題——亟需通用的微分方程求解工具。這些領域研究者對微積分方程求解的精度要求不高,卻十分看重求解速度,畢竟他們更關心如何利用求解結果解決實際問題,推動領域發展。因此,他們更需要精度適中、求解極快的微分方程求解器。
就像現在AI能寫很多代碼,但替代不了頂級的架構師。數學家也是一樣,能提出有意義數學問題、建立一套理論體系的數學家,AI會如虎添翼。
NBD:如果有了這把“萬能鑰匙”,AI可以做哪些數學工作?
董彬:AI能助力數學家,承擔枯燥繁瑣的驗證工作,未來甚至有望助力證明重要猜想。但這要求數學家精準把握AI能力,熟練運用AI工具。雖難確切預知這一天何時來臨,但預計未來一兩年會有初步成果。例如,今明兩年,部分數學猜想或許能借助人工智能完成,形式可能是AI獨立完成,也可能是在數學家協作下實現。?
NBD:現在大語言模型也能回答出很多數學題,這和您研究的AI4M有何不同?
董彬:北京大學的AI評測組會定期測試市面上優秀的AI大模型。雖然部分測試題目可能被AI接觸過,經過我們評估,當前頂尖語言模型在數學專業領域已達到研究生水平。這令人驚訝,但發揮極不穩定,比如我認為它不應該做對的題它能做對,我認為不應該犯錯的題目,它會“陰溝里翻船”。
我希望AI具備比肩頂級數學家的推理能力,以有效輔助數學家進行前沿探索,推理能力是AI發展的“皇冠上的明珠”AI4M不僅是AI賦能數學,更是雙向賦能。我們希望通過解析數學家的推理過程,將其應用于AI研究,提升AI的推理能力,同時讓數學推理能力遷移到其他需要推理的非數學領域。
NBD:您如何訓練AI的數學推理能力?
董彬:數學證明類似“搜索”,每一步都要尋找、嘗試數學技巧,簡化問題或靠近結論。定理證明可抽象成一個馬爾可夫決策過程,AI需在各狀態下選最“靠譜”操作,快速構建嚴密證明。數學家證明時也在探索,但受自身能力和知識局限,單位時間考慮的路徑、運用的技巧遠不如計算機高效全面。這正是AI用于數學推理的巨大優勢:解構數學家思維,發揮計算機大規模搜索和快速計算的長處,能讓AI短時間內擁有類似頂級數學家的推理、證明能力。
數學對推動人工智能發展極為關鍵,但目前AI領域工程推進快于理論研究,原因之一是數學理論研究效率較低,沒有數學家能精通所有數學工具。但如果類似鋼鐵俠的人工智能管家——賈維斯,AI全面掌握數學理論知識,數學家提供想法與直覺,就能大幅提升效率,縮小理論與實踐間的鴻溝。
董彬期望人工智能不只是智能導航工具,更要成為智能領航員和真正的伙伴。他認為:“一些數學家在思想、直覺和前瞻性方面具有獨到之處,但在證明技巧和部分工具運用上存在短板,而AI正好可以彌補這一不足。這樣的配合無疑是理想的。”
NBD:怎樣才能確認是AI自身的能力,而非基于數據檢索得到的結果呢??
董彬:分清AI是自主思考還是檢索現成答案并非易事。畢竟人類證明時調取記憶經驗,也類似“搜索”。關鍵要看AI能否構建自身數學知識體系,依據當下情境自行推導下一步,而非簡單輸出存儲答案。若AI遇到面對新問題能提出全新證明思路,或推導步驟邏輯連貫合理,并非拼湊已知結果,那就說明它在真正“思考”,借此可更好判斷它是否具備自主推理能力。
NBD:若未來舉辦人類和AI的數學“刷題大賽”,人類還有機會勝出嗎?
董彬:人類和AI培養邏輯推理都需要大量“刷題”,但AI刷題速度遠超過人類。人類解一道題的時間,AI能解千上萬道。數學對錯標準明確,這種效率差距更突出。這類似圍棋比賽,起初人們認為計算機難敵頂級高手,可AI憑計算和訓練速度優勢最終獲勝。數學領域也如此,AI訓練效率提升幾個量級后,極短時間就能達到極高推理水平,在“刷題大賽”中碾壓人類。因此,從效率和題量看,人類幾乎沒機會在這類比賽中勝出。這并非人類邏輯思維不行,而是AI在解題速度和規模上優勢巨大。?
NBD:您希望培養頂級AI數學家,還是為數學家打造個頂級AI工具??
董彬:AI與頂級數學家應相輔相成,能力需接近他們,就像數學家傾向挑選資質出眾的學生。服務頂級數學家的AI,自身能力必須與數學家相當。從人類視角,創新源于知識和推理能力結合。如今模型已積累海量知識,若再有頂尖人類的推理能力,就能開啟真正創新,畢竟人類創新依賴這兩種能力融合。?
學生要加入AI4M這個持久戰,難免會因短期難發論文有所顧慮。董彬理解他們的壓力,同時也積極引導:不是不發論文,而是要提升論文質量。“學生能發四五篇那種看摘要就知道研究套路、只是表述出彩的論文。我允許我的博士在畢業時只發一兩篇論文,但這些論文一定要讓人看了眼前一亮,會驚嘆:這件事居然還能這么做!”
NBD:您擔心數學會發展到盡頭嗎?或“吞并”所有學科?數學會走到盡頭嗎
董彬:數學永遠不會因為某些重大猜想被AI解決而走到盡頭。數學是一種語言,即使現有表述內容被攻克,還能創造新詞匯、概念,來描述自然界機制。把數學領域看作球體,其存在代表未完善部分的孔洞。過往數學家致力于填補孔洞、架起橋梁、完善內部結構。通用人工智能出現后,孔洞可能自動被修補,促使數學家將精力轉向拓展球體邊界,即擴充數學知識邊界。
NBD:與全球開展同類研究的團隊相比,你們研究進展速度如何?
董彬:谷歌DeepMind團隊是我們最大的競爭對手。2024年,我又喜又憂:喜的是發現DeepMind技術路徑與我們不謀而合,證明方向前景廣闊;憂的是,因為谷歌算力遠超我們,這促使我們調整目標和技術路徑,避免正面算力競爭。
評估DeepMind的內部研究進展非常困難。盡管在解決當前研究難題(尤其是獲取高質量數據)方面,DeepMind并沒有明顯的優勢,但在算力等資源方面卻具備一定優勢,因此整體競爭態勢難以判斷。
另一方面,中國也擁有獨特的優勢。廣泛且深厚的數學教育為我們的研究打下了堅實的基礎,團隊中聚集了頂級的基礎數學家,在領域知識和理論深度上表現突出,我們在關鍵環節上有獨到的視角和方法,這使得我們有望在競爭中取得突破。
NBD:若不久后AI能解所有數學題,現在學生學數學是學什么?
董彬:即使未來AI可解決所有數學題,學生學數學仍意義重大。數學核心是培養邏輯思維與推理能力,這些能力在各領域都至關重要。現在大模型訓練推理能力,也不只為解數學題,而是希望應用于其他學科。這和各專業學生都要學數學同理:無論技術多先進,嚴謹思考、系統分析問題的能力始終不可或缺。
(文中圖片除標注外,均為受訪者供圖)
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP