產經情報

Inflection AI 發表新基礎模型「Inflection-2.5 」,能力逼近 GPT-4!

日期:2024-03-12

由 Google DeepMind 共同創辦人 Mustafa Suleyman 以及 LinkedIn 共同創辦人 Reid Hoffman 成立的 AI 新創 Inflection AI,推出了新基礎模型「Inflection-2.5 」,公司表示模型能力可與 GPT-4、Gemini 匹敵,模型目前已在驅動聊天機器人 Pi。

MLU 基準測試中(檢測在高中到專業程度任務上的表現),Inflection-2.5 得分為 85.5,GPT-4 為 87.3;在兩項 STEM 測試中(匈牙利數學考試及物理 GRE)Inflection-2.5 分別拿了 63 分和第 85 百分位數,GPT-4 則是 68 分和第 97 百分位數。在 GSM8K 基準中 Inflection-2.5 拿 86.3 分而 GPT-4 為 92 分。

另外,Inflection-2.5 整合了即時網路搜尋功能,能為用戶提供最新時事資訊。Inflection 2.5 訓練的運算量(所使用的浮點數 FLOPs )僅為 GPT-4 的 40%,而模型能力可達 GPT-4 等級的 94%。

Inflection AI 最初很強調 Pi 聊天機器人具備高 EQ,回覆問題方式較口語化且友善,而 Inflection-2.5 的推出則是在 EQ 基礎上加入了 IQ。

Inflection 也首次分享了服務的使用量,Pi 擁有 100 萬名日活躍用戶和 600 萬明月活躍用戶,已對話了超過 40 億條訊息,過去兩個月用戶數每週以 10% 左右的速度成長。

Inflection-2.5 的推出加劇了 AI 聊天機器人的競爭,多間新創都在挑戰OpenAI的領導地位,包括近期 Anthropic 推出的 Claude 3,根據公司新模型提供正確答案的可能性為原來的兩倍。