国盛证券:OpenAI发布GPT4o 多模态实时交互能力重大突破

有栖花绯在线

IWEAP12AJDSF182812KLIASDF

  炒股国盛证券:OpenAI发布GPT4o 多模态实时交互能力重大突破就看

  发布会直播展示惊艳多模态交互能力,可以进行实时视频交互。GPT-4o(“o”代表“omni全能”)接受文本、音频和图像的任意组合作为输入,直播中GPT-4O展示了实时语音交流能力,响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

  GPT-4o的文本和图像功能今天开始在ChatGPT中推出。GPT-4o会在免费套餐中提供,向Plus用户提供高达5倍的消息限制。在未来几周内OpenAI将在ChatGPTPlus中推出带有GPT-4o的新版本语音模式。开发人员现在可以在API中将GPT-4o作为文本和视觉模型进行访问。与GPT-4Turbo相比,GPT-4o的速度快2倍,价格减半,速率限制高出5倍。

  我们认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、

  风险提示:AI技术迭代不及预期;算力紧缺的风险;宏观经济下行的风险。

  责任编辑:凌辰

联系我们