网易有道把看家模型开源了:27B参数打平行业最强,3秒克隆你的声音

作者: 智享AI发布日期: 2026/5/21阅读时间: 3分钟
网易有道把看家模型开源了:27B参数打平行业最强,3秒克隆你的声音 封面图

网易有道刚刚扔出了一枚重磅炸弹:最新的“子曰4”大模型不仅全面升级到多模态,还把核心的视觉数理模型和语音合成引擎直接免费开源。这意味着,任何开发者都能拿到这两套顶尖技术,直接用在自家产品里。

先说多模态模型。在27B参数这个规模上,“子曰4”处理带图表的数学题、物理题等视觉数理难题,性能跑到了行业最顶尖。它甚至能看懂你手写的草稿、照片里的公式,然后一步步给出答案。更狠的是推理成本——有道通过一种新的思维链压缩技术,把答案输出的Token数量砍掉了43.2%。简单说,以前算一道题要烧5毛钱电费,现在只要3毛,这对开发者和企业来说,省下的可是实实在在的真金白银。

开源语音合成引擎更让人眼前一亮。它支持14种语言,包括中文、英语、日语、韩语、德语等。最酷的功能是“3秒克隆”:你随便上传一段音频,系统3秒内就能复制出你的声音,相似度超过85%,准确度超过97%。而且,它还能保留你说话时的情感色彩——开心、严肃、着急,全都学得有模有样。跨语言说话时,也不会出现奇怪的口音混杂,听起来就像母语者一样自然。

翻译模型也没落下。有道这次用了一种叫“多专家OPD”的新模式,相当于让几个翻译高手同时干活再择优输出,同时加了奖励机制防止乱混语言。结果就是推理速度飙升了80%,翻译质量也明显提升。如果你用过有道翻译,最近可能会发现它反应更快、更准确了。

回看有道这几年的AI路线:从第一个教育垂直大模型“子曰”,到推出虚拟口语教练Hi Echo,再到现在的全模态开源,他们一直在做一件事——把底层技术开放出来,让更多人能快速做出好用的AI产品。这次的开源,就像把一把削铁如泥的刀递给了全世界的开发者,接下来能切出什么样的蛋糕,就看大家的想象力了。

aitechproduct
精选评论
评论加载中…
发表讨论 »