科大讯飞今日发布国内首个具备端到端语音同传能力的大模型 —— 星火语音同传大模型。
星火同传语音大模型支持译文长度反向调控,语音到文本端到端翻译支持流式意群切分、语境理解、信息重组,流式语音合成则支持意群韵律衔接、自适应语速调节。
星火语音同传大模型在内容完整度、信息准确度以及语言质量上都处于“行业领先水平”,超过谷歌 Gemini 2.0 和 OpenAI GPT-4o,最快实现 5 秒以内的同传时延,达到人类专家译员的水平。
官方演示了通过翻译机进行语音同声传译,可以看到一些专有词汇也能正常翻译。此外,讯飞星火翻译机可以记录回溯对话内容,还能够连接耳机、音箱等音频设备。
|