^{<tbody id="sbnkm"><blockquote id="sbnkm"></blockquote></tbody>}

商學(xué)院

多知商學(xué)院創(chuàng)辦于2017年，面向教育行業(yè)創(chuàng)業(yè)者、從業(yè)者、投資人，課程體系涵蓋系統(tǒng)課、專題課、大講堂，旨在連接行業(yè)頭部，直擊深度思考，提升商業(yè)認(rèn)知，催生自我迭代。

Open Talk

OpenTalk是多知組織的定期線下活動，邀請行業(yè)細(xì)分賽道頭部選手，分享行業(yè)新趨勢、時下最前沿的觀點和玩法，提供線上、線下多維度互動，也為多知讀者提供暢聊的見面機會。

Anthropic新模型將“推理模式”與“標(biāo)準(zhǔn)模式”混合：提高數(shù)學(xué)、物理等方面的表現(xiàn)

2025-02-26 08:17:25發(fā)布來源：多知作者：Penny

　　Anthropic周一發(fā)布名為Claude 3.7 Sonnet的模型，稱這種“混合型”模型同時具備“推理模式”(停下來思考復(fù)雜答案)與標(biāo)準(zhǔn)模式(實時生成答案)的能力。

　　Anthropic稱，Claude 3.7 Sonnet是市面上唯一的此類“混合”模型，并將立即投入使用。Kaplan將其比作人類大腦的運行方式：有的問題需要深度思考，有的問題需要快速作答。但Anthropic希望將這兩種能力整合在同一個模型中，而不是完全分開。

　　在標(biāo)準(zhǔn)模式下，Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升級版。

　　在擴展思維模式下，它會在回答前進行自我反思，從而提高其在數(shù)學(xué)、物理、指令遵循、編碼和許多其他任務(wù)上的表現(xiàn)。

　　在開發(fā)推理模型時，Anthropic對數(shù)學(xué)和計算機科學(xué)競賽問題的優(yōu)化較少，而是將重點轉(zhuǎn)向更能反映企業(yè)實際如何使用 LLM 的現(xiàn)實任務(wù)。

　　早期測試表明，Claude 在編碼能力方面全面領(lǐng)先：Cursor 指出，Claude 在實際編碼任務(wù)中再次名列前茅，在處理復(fù)雜代碼庫和高級工具使用等領(lǐng)域都有顯著改進。Cognition 發(fā)現(xiàn)，在規(guī)劃代碼更改和處理全棧更新方面，Claude 遠(yuǎn)勝于任何其他模型。Vercel 強調(diào)了 Claude 在復(fù)雜代理工作流程中的精確度，而 Replit 已成功部署 Claude 從頭開始構(gòu)建復(fù)雜的 Web 應(yīng)用程序和儀表板，而其他模型則停滯不前。在 Canva 的評估中，Claude 可生成具有卓越設(shè)計品味的生產(chǎn)就緒代碼，并減少了錯誤。

　　Claude 3.7 Sonnet 在指令遵循、一般推理、多模態(tài)能力和代理編碼方面表現(xiàn)出色，擴展思維在數(shù)學(xué)和科學(xué)方面提供了顯著的提升。除了傳統(tǒng)的基準(zhǔn)測試之外，它甚至在Pokémon 《精靈寶可夢》游戲測試中超越了所有以前的模型。

　　與此同時，媒體報道稱，Anthropic即將完成一輪35億美元的融資，公司估值將達到615億美元。公司本輪融資的最初目標(biāo)為20億美元，但在談判期間成功說服投資者增加投資。本輪融資的參與者包括Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners，總部位于阿布扎比的投資公司MGX正在洽談參與事宜。

　　在此此前，亞馬遜已向Anthropic累計投資80億美元，而谷歌母公司Alphabet已向其投資20億美元。

商學(xué)院

Open Talk

Anthropic新模型將“推理模式”與“標(biāo)準(zhǔn)模式”混合：提高數(shù)學(xué)、物理等方面的表現(xiàn)

相關(guān)閱讀

Anthropic新模型將“推理模式”與“標(biāo)準(zhǔn)模式”混合：提高數(shù)學(xué)、物理等方面的表現(xiàn)