就當我們還在為OpenAI的Sora實際效果感到震撼,驚嘆未來已來的時候。短短一個月,OpenAI的“家”就被人偷了,昨晚北京時間凌晨Anthropic公司宣布Claude-3正式發(fā)布,帶有三個高性能的模型形態(tài),并宣布在AI邏輯基準測試中超過了ChatGPT-4。
可能國內的小伙伴很少知道Claude,這是一個在海外備受關注且用戶基數(shù)較大的一個AI模型,其從誕生以來就一直與GPT相愛相殺,在AI性能排行榜上緊追不舍。其也是基于GPT(Generative Pre-trained Transformer)技術的大型語言模型,通過在大規(guī)模文本數(shù)據(jù)上的預訓練,學會了自然語言理解和生成的能力。
亞馬遜于今日宣布使用Claude3來優(yōu)化其商業(yè)邏輯
該系列包含三款各具特色的型號:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它們在性能與應用功能上各有側重,旨在滿足多樣化的應用場景需求。
Claude 3 Haiku
Haiku 型號憑借其極速處理能力和高性價比脫穎而出。它能夠在短短三秒內完成對一篇含有約 10,000 個標記、信息濃縮且數(shù)據(jù)密集的 arXiv 研究論文的閱讀工作,包括對圖表和圖形的理解。Haiku 尤其適用于那些對處理速度有極高要求但性能負荷相對較輕的平臺。
Claude 3 Sonnet
Sonnet 型號在處理大多數(shù)工作負載時的速度是 Claude 2 以及 Claude 2.1 的兩倍,且模型效果與性能一致,并提供更高層次的智能分析能力。它特別擅長處理那些需要快速反應的任務,例如知識檢索和銷售流程自動化等。
Claude 3 Opus
Claude 3 Opus 是系列中的高端型號,具備與市場上其他頂尖模型相匹敵的復雜視覺處理能力,能夠處理多種視覺格式,包括照片、圖表、圖形以及技術圖解。相較于 Claude 2.1,Opus 在解決開放性問題上的準確度提升了一倍,同時也顯著降低了錯誤答案的比例。
其他亮點
全系列模型均能處理超過 100 萬個標記的輸入,為那些需要更強大處理能力的客戶提供可靠支持。Claude 3 系列在執(zhí)行復雜多步驟指令方面表現(xiàn)卓越,尤其在遵循品牌語調和響應指南上,能夠為用戶打造出值得信賴的客戶體驗。此外,這些模型還擅長生成流行的結構化輸出格式,如 JSON。
目前,Opus 和 Sonnet 已經(jīng)通過 API 對外開放,開發(fā)者現(xiàn)可直接注冊并開始體驗這些尖端模型的強大功能。比如,POE就已經(jīng)支持Claude-3-Opus模型,購買POE“月卡”后就可以體驗。
超越GPT-4;兼顧視覺功能
根據(jù)Anthropic的說法,Claude 3 Opus 在10項人工智能標準測試中超越了GPT-4,包括MMLU(本科水平知識)、GSM8K(小學數(shù)學)、HumanEval(編程)以及HellaSwag(常識)。
其中一些勝利的優(yōu)勢非常微小,例如Opus在MMLU五次嘗試中得到86.8%的得分,而GPT-4得到86.4%,一些差距則較大,例如在HumanEval上Opus得到90.7%的得分,而GPT-4得到67.0%。這可能就意味著Claude 3對于新手碼農要更加友好。
與前代模型相比,Claude 3系列在分析、預測、內容創(chuàng)作、代碼生成以及多語言對話等方面展現(xiàn)了改進。據(jù)報道,這些模型還具備了增強的視覺能力,允許模型處理照片、圖表和圖解等視覺格式,類似于GPT-4V和谷歌的Gemini
在實際測試中,Claude 3相比于GPT-4V對于PDF的解讀要更加快速,同時對于中文輸出的邏輯與優(yōu)化也要明顯好于前代,也是達到了GPT-4平替的水準。
- QQ:61149512