贾浩楠 发自 凹非寺
量子位 | 公众号 QbitAI
语音合成大模型赛道,王者一夜易主。
最新HAM-TTS大模型,在发音准确性、自然度和说话人相似度上对比之前SOTA成果VALL-E,有了大幅提升。
背后的主要科研团队却是LLM赛道今年最令人意外的一匹“黑马”:
吉利汽车。
没错,不是AI原生公司,不是传统的科技巨头,是以汽车知名但正在不断展现硬科技实力的吉利。
吉利星睿AI大模型,有什么用?吉利自研语音大模型HAM-TTS的全称是:
Hierarchical Acoustic Modeling for Token-Based Zero-Shot Text-to-Speech,直译是基于token的零样