开啓無縫 AI 語音聊天，OpenAI 下周开始向 ChatGPT Plus 用戶推出 Alpha 版 GPT-4o 語音模式

金融界 2024-07-26 15:36

點贊： 0 評論：0

OpenAI 首席執行官山姆・阿爾特曼（Sam Altman）今天回復網友提問，表示將於下周面向 ChatGPT Plus 用戶，开放 Alpha 版本 GPT-4o 的語音模式（Voice Mode），實現無縫聊天。

IT之家今年 5 月報道，OpenAI 首席技術官穆裏・穆拉蒂（Muri Murati）在演講中表示：

在 GPT-4o 中，我們訓練了跨文本、視覺和音頻的端到端全新統一模型，這意味着所有輸入和輸出都由同一個神經網絡處理。

由於 GPT-4o 是我們第一個結合所有這些模式的模型，因此我們在探索該模型的功能及其局限性方面仍處於起步階段。

OpenAI 公司原計劃今年 6 月底，邀請一小部分 ChatGPT Plus 用戶測試 GPT-4o 語音模式，但官方在 6 月宣布推遲，表示需要更多時間打磨該模型，提高該模型檢測和拒絕某些內容的能力。

根據此前曝光的信息，GPT-3.5 模型的平均語音反饋延遲爲 2.8 秒，而 GPT-4 模型的延遲爲 5.4 秒，因此在語音交流方面不太優秀，而即將推出的 GPT-4o 可以極大地縮短延遲時間，近乎無縫對話。

責任編輯：山上

發表評論 0條評論