Descript 如何实现大规模多语言视频配音

English 日本語 Español

OpenAI 2026年03月06日

Descript 重新设计了视频配音流程，利用 OpenAI 模型同时优化语义保真度和时长一致性，显著提升了自然语速。

阅读全文

内容摘要

Descript 是一款以人工智能为核心的视频编辑器，它通过重新设计翻译流程，解决了多语言视频配音中语义准确性和时长一致性难以兼顾的问题，从而显著提升了配音的自然度。

过去，翻译结果虽然语义正确，但由于不同语言表达相同意思所需时间不同（例如德语通常比英语“长”），导致配音语速不自然。Descript 的新方法利用 OpenAI 推理模型，特别是其在音节计数等任务上的一致性，在生成过程中同时优化语义保真度和时长一致性，而不是事后修正。

此次改进使配音的自然语速范围内的片段比例从 40%-60% 提高到 73%-83%，并使翻译视频的导出量增加了 15%。Descript 正在构建批量处理功能以支持大规模内容本地化，并计划未来使流程更加多模态，以更好地保留语调和强调等非语言特征。

(来源：OpenAI)

English 日本語 Español

阅读全文

Anthropic 获得 Amazon 50 亿美元投资，并承诺投入 1000 亿美元云计算支出作为回报

Google 在七个新国家/地区推出 Chrome 中的 Gemini

它不只是这一件事 —— 它还是另一件事

流行的基于 Rust 的数据库转向 AI 以实现高达 1.5 倍的速度提升及其他改进

Fortnite 开发者现在可以创建 AI 角色了——只是不要试图与他们约会

通过您的 Google AI 订阅在 AI Studio 中开始“vibe coding”。

据报道，尽管与五角大楼存在分歧，美国国家安全局（NSA）仍在使用 Anthropic 的 Mythos

CEO and CFO suddenly depart AI nuclear power upstart Fermi

OpenAI 的存在性问题

云开发平台 Vercel 遭到黑客攻击