近日,声网发布全球首个对话式AI引擎,可支持任意文本大模型快速升级为“能说会道”的对话式多模态大模型。
在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的必经之路,声网作为实时互动云行业的开创者,在音视频领域积累了技术优势与场景实践,致力于将RTE与生成式AI结合。此次推出对话式AI引擎,为开发者带来“多快好省”的AI语音对话体验。
据悉,声网对话式AI引擎支持包含DeepSeek、ChatGPT等在内的全球几乎所有大模型厂商,也支持全球主流语音合成供应商任意切换。通过在中、美、欧、东南亚主要城市实测,语音对话延迟中位数低至650ms,让AI秒回你的提问。自研“智能打断”技术,模拟真人对话节奏,随时打断与AI的对话,响应低至340ms。
最大的卖点还在于低成本。据介绍,AI语音对话只需0.098元/分钟,单次赠送1000分钟。自研的“智能打断”功能作为增值服务只需0.042元/分钟,以更低的成本助力开发者探索AI应用场景。
通过声网对话式AI引擎,开发者可以快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能硬件等对话式AI场景。
“之前大模型都是文字,现在通过RTE让大模型能够听懂看懂,场景更丰富,未来会有更多应用落地。”声网产品线负责人和利鹏说。
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。