你的位置:开云(中国)kaiyun网页版登录入口 > 新闻动态 > 开云体育时候降本带来用户体验跃升-开云(中国)kaiyun网页版登录入口

开云体育时候降本带来用户体验跃升-开云(中国)kaiyun网页版登录入口

时间:2025-03-03 11:37 点击:73 次

在新一波的时候海潮中,大言语模子风头正劲,但还有一种AI时候,正在配音、直播、客服等多个行业正阐扬出越来越无为的哄骗。2月18日,京东言犀公布了两项最新时候后果——语音合成大模子LiveTTS及通用数字东谈主大模子2.0,因循zero-shot音色复刻和极品音色微调,并因循更精确的数字东谈主声唇对皆,将大幅提高东谈主机当然交互体验,当前已针对直播、外呼、客服、营销等超10种特定生意化场景完成调优适配。时候降本带来用户体验跃升,预测也将带动更多AI营销行状增量市集。

语音合成大模子全新升级 因循zero-shot音色复刻和极品音色微调

LiveTTS,是京东言犀最新发布的高仿真、多言语、热沈丰富的语音合成(TTS)大模子,通过AI 时候生成当然、具备韵律且富余热沈的语音。当今,只需喂给LiveTTS模子最短3秒音频素材,就能因循zero-shot音色复刻以及极品音色微调,近乎齐备的对声息进行复刻。

这收获于基于Diffusion架构完成的20万小时数据"熔真金不怕火"。在SeedTTS test-hard测试中,其CER揣测打算(字符瑕疵率)较其他头部厂商模子缩短了0.2%-5.12%不等,十分于每万字最多能减少512处发音作假。在主不雅评价上,通过盲评的MOS评测,该模子尤其在音色雷同度、当然明晰度、热沈抒发一致性方面阐扬出色,音色雷同度较其他头部厂商模子越过1.3倍。

从语音准确性上,言犀连合汉文拼音与英文音素双输入系统,提高了发音准确性,让时候更可用。从仿真度上,遴荐高质地的HiFt声码器,杀青超98%的声纹收复精度。

渊博的及时、各样性语音数据加入锻真金不怕火,也进一步提高了模子的泛化才智,让模子或然在不同音频教导词(prompt)的条款下合成韵律丰富、当然的音频,愈加易用。LiveTTS还是能适配从儿童俏皮声到老年东谈主千里稳语调的各样化需求,还因循中/英/日等多语种及方言的语音合成。

极低门槛、极致拟真、极多场景,是言犀LiveTTS语音合成大模子的上风。基于LiveTTS打造的言犀数字东谈主,因循近百个不同立场音色,酿成围绕直播场景需求的声息供应链。2024年京东11.11时辰,言犀TTS单日调用超1000万次,老本直降90%,大大提高直播、配音、外呼等行业的使命服从。

数字东谈主大模子杀青精确声唇同步 教学AI坐褥力

言犀数字东谈主已无为哄骗在电商直播、客服欢迎、短视频等场景中,光是使用数字东谈主平方开播的商家就有卓越7500家。但数字东谈主向更大范围的领域化哄骗永恒存在三个难点:形象数据网罗老本高、模子锻真金不怕火周期长和推理效果难泛化。

为了贬责这些问题,言犀团队提议了新一代声唇同步数字东谈主基座模子,通过立异的多阶段基模子锻真金不怕火方法、多图参考的多层属眼力机制等方法。这一亿级参数目的声唇同步基座模子,进一步拓展了数字东谈主在守秘、大角度、多语速、跨音色和多言语等场景的哄骗。当前,在动态配景、多东谈主直播等的确哄骗场景里,言犀数字东谈主的唇形匹配度仍达到95%,具备较好的泛化才智,在各式场景中更可用,更易用。

在新一代数字东谈主基座大模子因循下,仅需一张带东谈主像的图片或短视频、一份商品统一,言犀就不错自动生成运动丰富的带货剧本,连合LiveTTS生有益理化口播,数字东谈主便生气勃勃“活”起来。这种花式,告别了传统、冗长的数字东谈主模子锻真金不怕火过程,杀青平直推理,既省去了锻真金不怕火老本,还进一步膨胀了数字东谈主在视频翻译等低数据量场景的哄骗界限。

除了直播外,平台还能因循输出数十条不同立场的数字东谈主种草短视频。悉数过程从过往的至少72小时压缩至分钟级,老本仅为传统数字东谈主制作的十分之一,进一步杀青时候降本。 

言犀最新发布的两项时候后果,并非单纯的时候跑分竞赛,而是旨在进一步缩短AI哄骗的老本,新一代的语音合成LiveTTS模子及数字东谈主大模子2.0,正在短视频合成、数字东谈主直播、视频翻译、数字东谈主唱歌舞蹈等多个生意化场景中哄骗,让大模子变成商家东谈主手必备的普惠器具。

手脚品牌的AI营销搭子开云体育,言犀将胁制配置出更多因循营销场景的时候与产物,进一步缩短中小商家哄骗门槛,加快AI坐褥力走进营销场景。

新闻动态

新闻动态

新闻动态

Powered by 开云(中国)kaiyun网页版登录入口 RSS地图 HTML地图


开云(中国)kaiyun网页版登录入口-开云体育时候降本带来用户体验跃升-开云(中国)kaiyun网页版登录入口

回到顶部