每日經濟新聞 2025-04-22 22:06:24
近日,字節跳動Agent產品“扣子空間”開啟內測,邀請碼在社交平臺緊俏。《每日經濟新聞》記者實測發現,“扣子空間”在歸納整理信息、制作圖表等任務上完成度較高,但暫不支持多模態任務。業內認為,Agent是AI發展的必經之路,字節跳動憑借生態優勢入局,但創業公司仍有機會通過專業深入發展立足。同時,Agent商業化仍在探索中。
每經記者 楊昕怡 每經編輯 陳俊杰
“接下來,AI(人工智能)的重點將從解決問題轉向定義問題。”近日,OpenAI研究員姚順雨在其新博文中表示,AI下半場的重點將從解決問題轉向如何定義有現實意義的任務,如何有效評估AI系統的表現,“要思考‘我們應該訓練AI做什么?我們如何衡量真正的進步?’”
當Agent(智能體)已成大勢所趨,字節跳動近期開啟了其Agent產品“扣子空間”的內測。哪怕是在邀請制度下,擁有如字節般的算力資源,服務器還是被用戶的熱情擠爆了,產品邀請碼也成為社交平臺和二手交易平臺上的緊俏“硬通貨”。
4月22日,在獲得邀請碼后,《每日經濟新聞》記者第一時間進行了深度實測。實測過程中,記者發現“扣子空間”在歸納整理現有信息、制作可視化圖表及網頁等任務方面完成度較高,但現階段還未能進行多模態任務,例如主動獲取并分析圖片、視頻中的信息。
從商業化角度來看,曾經“一碼難求”的AI Agent產品“Manus”已在3月末公布了用戶收費細則,如今字節跳動、百度等頭部“大廠”接連布局,Agent是否會帶來一條清晰的變現路徑?在“大廠”的生態優勢和算力資源面前,創業公司打造Agent產品中的機會何在?
每經記者實測“扣子空間”
“太快了,沒了”“求個邀請碼”“爆滿了”,在“扣子空間”正式開啟內測后,小紅書、即刻等社交平臺上涌現出大批想去體驗的用戶,該產品的邀請碼甚至在閑魚等二手交易平臺上被明碼標價交易。
官網顯示,“扣子空間”主打生產力全面提升、專家能力深度支持、寫作模式靈活調整以及能力邊界拓展延伸的優勢。官網展示了市場調研報告分析、股票早報定制、生成互動式教學網站以及旅游攻略制作等16個典型應用場景。“在扣子空間里,精通各項技能的‘通用實習生’,各行各業的‘領域專家’,任你選擇。”
《每日經濟新聞》記者注意到,“扣子空間”具有探索與規劃雙模式,前者完成任務速度更快,后者則是AI規劃步驟、用戶可以分步進行修改任務指令。同時,“扣子空間”首批集成了高德地圖、飛書多維表格、墨跡天氣和Notion等MCP(模型上下文協議)服務,供用戶在發布任務時自由調用。
“Agent可以做的事情更多,很多事情不限于文本交互。”一位頭部大模型技術人員在接受《每日經濟新聞》記者電話采訪時表示,相較于Chatbot(聊天機器人),Agent可以自主地學習調用工具、處理涉及多模態的復雜任務。
在獲得邀請碼后,《每日經濟新聞》記者第一時間就復雜旅游規劃、互動型小游戲制作以及視頻信息提取等任務對“扣子空間”進行了深度實測。
每經記者實測“扣子空間”
首先在旅游規劃上,在提出“今年‘五一’假期,我和父母要去日本東京玩6天,想看富士山,還想吃到當地特色小吃和2家米其林餐廳。請你為我制作一個圖文并茂的旅行手冊”的需求后,Agent將該任務拆解為信息收集、資料整理與撰寫和手冊制作三步,最后耗時30分鐘,交付了一個包含每日旅游線路地圖、觀賞地點以及天氣情況的網頁。
每經記者實測“扣子空間”
該網頁設計風格簡潔優美,但旅游攻略制定得較為籠統,例如在餐廳詳細信息以及預約情況等內容上有所缺失。
每經記者實測“扣子空間”
隨后,記者向“扣子空間”提交了制作一個植物科普小游戲網頁的請求,一個名為“植物科普小花園”的簡單互動小游戲旋即生成。小游戲頁面展現了4種卡通風格的常見植物,點擊每種植物即可了解其基本信息和相關小知識。
每經記者實測“扣子空間”
但美中不足的是,這些植物以卡片形式呈現,而非提示詞中要求的“希望背景是一個大花園,常見植物栽種其中,呈現動態搖擺狀態”。對此,一位大模型算法工程師通過微信向記者解釋,對于現在能調用的MCP來說,實現這一指令太困難。“還沒有給AI用的游戲制作軟件。”
在視頻信息提取任務上,記者注意到,“扣子空間”可以根據提示詞自主尋找到B站平臺上的相關視頻,但暫時還無法進行視覺推理。
“要讓AI真正為各行各業帶來變革,Agent是必經之路。”在4月17日進行的火山引擎AI創新巡展杭州站會后,火山引擎總裁譚待在接受《每日經濟新聞》記者采訪時表示。
在他看來,具備能完成專業度較高、耗時較長的完整任務的能力,才能稱之為Agent。“能完成打油詩、簡單報告等任務的不能稱為Agent。”他說:“從技術實現角度來看,如果沒有運用思考模型,缺乏反思和規劃能力,也很難被認定為Agent。”
一位頭部大模型技術人員在接受記者電話采訪時表示,從技術方面來看,目前Agent可以分為兩種,即以OpenAI o3為代表的基于Agent任務訓練微調的模型,以及依賴預訓練能力、提示詞工程和系統設計的LLM(大語言模型)系統。“Perplexity、Manus都屬于后者,扣子空間大概率也是。”
在Agent的布局過程中,Claude母公司Anthropic推出的MCP成為近期國內外頭部廠商的一大關注點。MCP通過統一的協議標準,使Agent能夠以一致的方式接入各種本地或遠程工具,降低了開發復雜度。
在4月17日的采訪中,譚待表示協議統一很重要。“如果能做到統一協議,大家的應用開發就會更快,模型調用也會更智能。”
“字節跳動擁有視頻、電商、本地生活、移動辦公等豐富多元的應用生態體系,它去做Agent就有初創企業根本無法比擬的優勢。”快思慢想研究院院長田豐接受《每日經濟新聞》記者采訪時表示,“因為它能調用的工具、App非常多,而初創企業需要一家家(合作方)去談,而且就算技術上都支持MCP,也存在商業授權問題”。
既然“大廠”在Agent領域已有自己的先發優勢,那么創業公司發力Agent還會有機會嗎?
“當然有了。”田豐很篤定。他以近期OpenAI計劃以30億美元收購AI編程初創公司Windsurf為例,“這家公司在編程決策智能上就有很強的差異性,而且做得非常專。所以做專業、做深入,永遠會是創業公司的(立身)基礎”。
工信部信息通信經濟專家委員會委員盤和林也通過微信向《每日經濟新聞》記者表示,“大廠”雖在Agent產品上有優勢,但其產品可能會難以滿足垂直行業的深度需求。“現階段的 Agent和垂直領域需求的融合難度還比較大,主要還是解決一些特定領域的問題,比如寫代碼。”
與此同時,記者注意到,國內外一些知名Agent已推出付費模式。例如,Manus在今年3月末宣布推出每月39美元和199美元的兩種套餐。
談及Agent未來的商業化可能性,田豐認為,現在Agent屬于早期發展階段,字節跳動等“大廠”需要打通更多工具的調用渠道,培養出一個良好的開發者生態,“直到Agent可以解決用戶剛需問題,真正提高生產力、讓用戶有生產提效效益時,用戶自然愿意進行付費”。
封面圖片來源:視覺中國-VCG211478193393
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP