文章详情

专注互联网科技,赋能企业数字化发展

文心一言专业版语音

作者:文心一言专业版语音

这次 ChatWithMe 0.0.6 的重点,是语音输出和声音克隆。 之前它更多是一个手机上的 AI 工作台:可以接自己的模型 API、聊天、读文件、整理资料、用 Skills。现在我给它补上了一个很想做的能力:让 AI 回复可以直接变成声音。 这版支持小米 MiMo 和阿里云百炼 Qwen-TTS。你可以手动播放 AI 回复,也可以开启自动朗读,让它回复完之后直接念出来。 最有意思的是小米 MiMo 的克隆音色。现在可以上传多段音频样本,应用会显示每段音频的大小、时长、格式,还会告诉你哪些样本会参与合成、样本质量大概如何。比如你想做一个更有陪伴感的 AI 角色,或者让“电子女友”真的开口说话,这个功能就能派上用场。 当然,声音克隆必须谨慎使用。所以第一次进入语音输出功能时,会弹出隐私和授权确认,提醒你朗读文本和参与合成的样本会发送给对应服务商,也要求确认你拥有声音使用授权。 除了语音,这次还修了很多实用问题: 文件读取更稳了,Word、Excel、PPT、PDF、ZIP 都更适合让 AI 直接理解。PPTX 现在会按幻灯片读取,不再被当成普通压缩包。长回复的 Markdown 渲染也顺滑了很多,表格、长文本、滚动卡顿都做了优化。 这版感觉终于从“能用的 AI 工具”往“有点陪伴感的手机 AI 工作台”迈了一步。#AI工具 #harmonyos #声音克隆技术 #TTS

返回新闻列表