OLMo:真正的完全开源大模型 OLMo(Open Language Model)与其他开源语言模型的不同之处在于其“完全开放的框架”。 OLMo不仅100%开放了其完整的预训练数据——3万亿token的Dolma数据集 还提供了其... AI前沿 2年前27,6400
AI数字人活了?一张照片就能唱歌和说话,表情动作自然!Emo AI带你进入未来的艺术世界 AI新技术:Emo AI让照片唱歌和说话 什么是Emo AI? Emo AI是一个新兴的人工智能项目,它能够让任何一张照片具备唱歌和说话的能力。这项技术通过给定的照片和音频文件,自动生成相应的面部表情... AI前沿# AI# AI数字人# AI艺术 2年前32,9710
EMO: 激活表情肖像视频的生成 – 在弱条件下利用Audio2Video扩散模型 作者:Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo 机构:阿里巴巴集团智能计算研究院 概述 我们提出了EMO,一个表情丰富的音频驱动的肖像视频生成框架。只需... AI前沿# EMO# 肖像视频生成# 虚拟角色 2年前31,9830
中国版Sora横评:字节CapCut AI Video领跑,创企展现实力! 中国版Sora横评:字节CapCut AI Video领跑,创企展现实力! 概述 2024年3月1日报道,距离OpenAI发布Sora已经过去十几天,中国版Sora的表现受到广泛关注。本次评测深... AI前沿# AI视频生成# sora# 国产AI工具 2年前40,1160
剪映AI绘图应用Dreamina:张楠的野心与努力! 引言 近日,剪映AI绘图应用Dreamina上线网页端,标志着张楠全心投入剪映的成长与突破。剪映在AI领域的努力是认真的。然而,Dreamina被指与国内AIGC初创公司Tiamat的logo雷同,引... AI前沿# AI绘图# Dreamina# 内容创作 2年前24,5830
Playground v2.5 介绍,领先开源模型,探索文本到图片生成的新境界! Playground v2.5 介绍,领先开源模型,探索文本到图片生成的新境界! 什么是Playground v2.5? Playground v2.5 是最新的文本到图片生成模型,它是目前开源模型中... AI前沿# HuggingFace# 人类中心细节# 多长宽比 2年前32,8860
Google AI工具Gemini的问题和修复 Gemini的问题 Gemini是Google最近推出的一个AI工具,它可以回答文本形式的问题,也可以根据文本提示生成图片。然而,Gemini的一些回答和生成的图片引发了争议。例如,它生成了一张美国开... AI前沿# AI# Gemini# Google 2年前22,2820
PIKA上线唇形同步:AI视频的新突破,让人物真实对话! PIKA上线唇形同步:AI视频的新突破,让人物真实对话! PIKA的更新动态 PIKA在沉寂了3个月后,终于又更新了。他们没有去追求模型的更新,或者控制的优化,而是继续奔赴他们1.0最开始所设定的目标... AI前沿# AI视频# PIKA# 唇形同步 1年前32,9640
AI突破:成功预测核聚变等离子体撕裂,迈向无限清洁能源 可控核聚变在解决未来能源危机方面扮演着至关重要的角色,它被誉为清洁能源的「圣杯」。然而,等离子体不稳定性长期以来一直是困扰核聚变实现的一大难题。最近,普林斯顿团队通过AI技术成功预测了核聚变中的等离子... AI前沿# AI# Nature# 普林斯顿 2年前22,1830
Stable Diffusion 3来啦!文本理解更好,图像质量更强,AI算力消耗更低,推理速度更快! 简介 Stable Diffusion 3是由stability.ai开放社区在2022年2月23日推出的新版本。这个版本相比于Stable Diffusion 2在文本语义理解、色彩饱和度、图像构图... AI前沿# AI# AI模型# FlowMatching 1年前30,1070