3月6日,很多人為了拿到Monica.im研發(fā)的世界首款AI Agent產品Manus的邀請碼而“四處奔波”。Manus在GAIA基準測試中創(chuàng)下新紀錄,標志著其作為一款高度先進的通用AI助手的地位。
朋友圈幾乎被Manus刷屏,上一次出現類似情景還是在GPT和DeepSeek發(fā)布時。二級市場已經注意到Manus,阿里、騰訊等股票在開盤后迅速上漲。昨晚美股交易時段,相關邏輯已經顯現,ADR(美國存托憑證)市場也有所反應。
與傳統(tǒng)AI模型不同,Manus不僅能夠生成想法,還能在現實世界中執(zhí)行任務,使其能夠自主完成復雜任務。一項演示展示了其撰寫報告和創(chuàng)建定制化表格的能力。這款AI代理還配備了高度自適應的“數字大腦”,能夠進行獨立學習、處理復雜指令并實現跨領域協(xié)作。
據其團隊介紹,Manus是一款真正自主的AI代理,能夠處理各種復雜和動態(tài)的任務。與傳統(tǒng)AI助手不同,Manus不僅提供建議或答案,還能交付完整的任務結果。
Manus采用由多個獨立模型驅動的多簽名(multisig)系統(tǒng)。這意味著Manus的核心功能由多個獨立的AI模型共同完成。每個模型可能專注于不同的任務或領域,例如自然語言處理、數據分析、推理等。這些模型協(xié)同工作,能夠處理更復雜、多樣化的任務,同時提高系統(tǒng)的魯棒性和準確性。今年晚些時候,官方計劃開源部分模型,特別是Manus的“后處理”(推理)部分。
據了解,Manus采用的“虛擬機 + 計算使用 + 生成物(artifacts) + 內置多個agents”綜合架構,可以理解為在類似Cursor的產品上增加了一層外殼,并整合了多個小模型。Cursor類產品對普通人門檻較高,而Manus降低了使用門檻。
目前業(yè)界普遍采用類似思路,OpenDevin等團隊也有類似產品。Claude在處理此類任務時表現也很強。如果這種模式跑通,Coze、Dify等產品也可能推出類似路線,同時這類能力可能被大模型內化。
與Manus同時受到關注的,還有一個4分鐘的演示demo。在這些案例中,Manus自主完成了從規(guī)劃到執(zhí)行的整個過程,展示了真正的代理能力,而非簡單的助手功能。
例如,第一個任務是從15份簡歷中篩選出適合強化學習算法工程師職位的候選人。Manus展現出類似人類實習生的特質,手動解壓文件并逐頁查看每份簡歷,同時記錄關鍵信息。官方團隊表示,所展示的只是Manus能力的冰山一角。
當AI Agent通過調用長鏈思維和工具利用,最終輸出一個完整且專業(yè)的結果時,用戶開始驚嘆于AI真正能夠幫助人類完成任務。
為確保結果的可重復性,Manus使用了與其官方版本相同的配置進行評估。
據官網介紹,在GAIA基準測試(評估通用AI助手解決現實世界問題的能力)中,Manus在所有三個難度級別上都達到了新的最先進(SOTA)性能。
Manus AI背后的創(chuàng)始人肖弘畢業(yè)于華中科技大學軟件工程專業(yè)。畢業(yè)后,他開啟了一系列創(chuàng)業(yè)之旅,2015年創(chuàng)立了夜鶯科技,并推出了壹伴助手和微伴助手,服務超過200萬B端用戶,獲得了騰訊、真格基金等投資。
他還開發(fā)了Monica,一款被稱為“全能”的AI助手產品,最初作為瀏覽器插件推出。通過整合主流大模型(如Claude 3.5、DeepSeek等),Monica提供聊天、翻譯、文案撰寫等功能。Monica最初專注于海外市場,用戶數突破百萬,成為AI插件領域的領先產品。今年2月,Monica中文版開始內測,目前對國內用戶免費開放。該版本基于DeepSeek R1和V3模型,具備深度推理能力,支持記憶功能和實時互聯(lián)網搜索。
Manus秉持“少結構多智能”的技術理念,這與主流觀點有所不同。他們認為,當數據質量足夠高、模型足夠強大、架構足夠靈活、工程足夠穩(wěn)健時,計算機使用、深度研究、編碼代理等能力自然會涌現,無需將其設計為特定的產品功能。
目前,幾乎所有的AI領域科技公司都在關注“AI代理”。3月6日,OpenAI宣布將為醫(yī)生級AI代理每月收取2萬美元(約合14.5萬元人民幣),主要針對企業(yè)用戶的高端需求,尤其是在金融、醫(yī)療、制造等數據密集型行業(yè)。