MiniMax Audio 发布 Speech-02 语音模型:支持 30 多种语音,一次输入 20 万字符 什么是 MiniMax Audio Speech-02 语音模型? MiniMax Audio 发布了其最新的 Speech-02 系列语音模型,该模型旨在提供更真实、流畅和便捷的音频体验。它支持 3... AI前言# LongTextMode# MiniMax Audio# MinimaxAudio 7个月前14,1530
AI播客来袭:扣子空间一键生成拟真中文播客全体验 如何使用AI一键生成拟真中文播客?扣子空间AI播客体验全解析 1. AI播客:内容创作的新可能? 1.1 什么是AI播客?为什么它会让你感到震撼、恐惧又兴奋? 你是否想象过,只需一篇文章,就能一键生成... AI前言# AI工具# AI播客# https 7个月前15,8900
ElevenLabs Flash:全球最快语音生成模型详解 什么是 ElevenLabs Flash 模型? ElevenLabs 推出了全新的语音生成模型,名为 Flash。这款模型以其惊人的速度和高质量的语音输出而备受瞩目。它究竟有哪些特点呢? Flash... 大模型专区# AI语音# 人工智能# 文本转语音 1年前20,6600
Gemini 2.0 的原生图像生成与可控文本转语音:这意味着什么? Gemini 2.0 的新特性:原生图像生成和可控文本转语音 1. 什么是原生图像生成? 1.1 传统图像生成方式的局限性 在 Gemini 2.0 之前,很多 AI 模型虽然可以生成图像,但往往需要... ChatGPT中转API# AI# CHATGPT中转API# Gemini 1年前21,7470
【Bert-Vits2】文本转语音工具,可训练自己的声音用做配音解说等 今天我给大家带来一个全新的项目整合包。相比之前的快速微调,这个项目生成的中文语音质量更好。原作者的视频链接我已经放在简介里了。我对项目进行了快速微调并修正了部分代码,使其能正常运行,并增加了新的功能... AIGC项目教程# 文本转语音 2年前25,9670