AI前沿资讯,AI行业资讯,AI热门技术 - 关于AI行业人工智能最先进的资讯和产品 | 第116页

OLMo：真正的完全开源大模型

OLMo（Open Language Model）与其他开源语言模型的不同之处在于其“完全开放的框架”。 OLMo不仅100%开放了其完整的预训练数据——3万亿token的Dolma数据集还提供了其...

AI前沿

2年前

27,6400

AI数字人活了？一张照片就能唱歌和说话，表情动作自然！Emo AI带你进入未来的艺术世界

AI新技术：Emo AI让照片唱歌和说话什么是Emo AI？ Emo AI是一个新兴的人工智能项目，它能够让任何一张照片具备唱歌和说话的能力。这项技术通过给定的照片和音频文件，自动生成相应的面部表情...

AI前沿 # AI # AI数字人 # AI艺术

2年前

32,9710

EMO: 激活表情肖像视频的生成 – 在弱条件下利用Audio2Video扩散模型

作者：Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo 机构：阿里巴巴集团智能计算研究院概述我们提出了EMO，一个表情丰富的音频驱动的肖像视频生成框架。只需...

AI前沿 # EMO # 肖像视频生成 # 虚拟角色

2年前

31,9830

中国版Sora横评：字节CapCut AI Video领跑，创企展现实力！

中国版Sora横评：字节CapCut AI Video领跑，创企展现实力！概述 2024年3月1日报道，距离OpenAI发布Sora已经过去十几天，中国版Sora的表现受到广泛关注。本次评测深...

AI前沿 # AI视频生成 # sora # 国产AI工具

2年前

40,1160

剪映AI绘图应用Dreamina：张楠的野心与努力！

引言近日，剪映AI绘图应用Dreamina上线网页端，标志着张楠全心投入剪映的成长与突破。剪映在AI领域的努力是认真的。然而，Dreamina被指与国内AIGC初创公司Tiamat的logo雷同，引...

AI前沿 # AI绘图 # Dreamina # 内容创作

2年前

24,5830

Playground v2.5 介绍，领先开源模型，探索文本到图片生成的新境界！

Playground v2.5 介绍，领先开源模型，探索文本到图片生成的新境界！什么是Playground v2.5？ Playground v2.5 是最新的文本到图片生成模型，它是目前开源模型中...

AI前沿 # HuggingFace # 人类中心细节 # 多长宽比

2年前

32,8860

Google AI工具Gemini的问题和修复

Gemini的问题 Gemini是Google最近推出的一个AI工具，它可以回答文本形式的问题，也可以根据文本提示生成图片。然而，Gemini的一些回答和生成的图片引发了争议。例如，它生成了一张美国开...

AI前沿 # AI # Gemini # Google

2年前

22,2820

PIKA上线唇形同步：AI视频的新突破，让人物真实对话！

PIKA上线唇形同步：AI视频的新突破，让人物真实对话！ PIKA的更新动态 PIKA在沉寂了3个月后，终于又更新了。他们没有去追求模型的更新，或者控制的优化，而是继续奔赴他们1.0最开始所设定的目标...

AI前沿 # AI视频 # PIKA # 唇形同步

1年前

32,9640

AI突破：成功预测核聚变等离子体撕裂，迈向无限清洁能源

可控核聚变在解决未来能源危机方面扮演着至关重要的角色，它被誉为清洁能源的「圣杯」。然而，等离子体不稳定性长期以来一直是困扰核聚变实现的一大难题。最近，普林斯顿团队通过AI技术成功预测了核聚变中的等离子...

AI前沿 # AI # Nature # 普林斯顿

2年前

22,1830

Stable Diffusion 3来啦！文本理解更好，图像质量更强，AI算力消耗更低，推理速度更快！

简介 Stable Diffusion 3是由stability.ai开放社区在2022年2月23日推出的新版本。这个版本相比于Stable Diffusion 2在文本语义理解、色彩饱和度、图像构图...

AI前沿 # AI # AI模型 # FlowMatching

1年前

30,1070

AI前沿

智能体