频道：网站首页 > 互联快讯 > >文章内容

腾讯混元开源端到端AI音效生成模型

时间：2025-08-28 17:13 来源: 科技快报网阅读量：6570

8月28日，腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley，该模型通过输入视频与文字描述即可自动生成电影级音效，打破传统AI视频“无声”局限。

据官方演示显示，其能精准匹配引擎轰鸣、树叶沙响等复杂声效，能“看懂画面、读懂文字、配准声音”，实现“画面-文字-声音”协同，带来沉浸式视听体验。

技术亮点包括:

多模态理解:同步解析视觉内容与语义指令，动态生成环境音、拟音等；

工业级应用:适配短视频、影视制作、游戏开发等领域，降低专业音效设计门槛。

此次开源延续腾讯混元“技术普惠”战略，开发者可通过官方渠道获取模型权重及工具链。

免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。

热点精选

华天软件深度参与CAD学术盛会，彰显国产三维CAD龙头引领地位2025-08-28 04:50
安全搭建远程办公体系！贝锐向日葵分级授权+操作追溯解痛点2025-08-28 03:16
美团发布2025年Q2财报：营收918亿元，用户交易频次再创新高2025-08-28 01:56
“装备”你的每一步京东3C数码全程护航哈尔滨马拉松2025-08-28 00:36
天下秀发布2025年上半年财报：营收18.44亿元，AI驱动全球化布局提2025-08-27 23:59
开学季装机，Ultra5230F搭配技嘉B860M电竞雕打造高性价比学习2025-08-27 23:28
知乎Q2营收7.17亿元连续三个季度实现盈利2025-08-27 22:20
AI智能成标配，苏宁易购引领空调换新潮2025-08-27 20:49
苹果秋季新品发布会定档9月10日天猫上线直播预约2025-08-27 19:19
餐饮品牌加盟新探索：流浪泡泡推出风险兜底计划2025-08-27 18:16

热门内容

推荐阅读

关于我们 | 联系我们 | 投稿合作 | 网站地图 | RSS订阅

版权所有©IT产业网

所载文章、数据仅供参考，使用前务请仔细阅读网站声明。本站不作任何非法律允许范围内服务!

联系我们: jokerdeyouxiang@sina.com

备案号：皖ICP备2023005497号