学AI很简单-易之网
AI前沿
关于AI行业人工智能最先进的资讯和产品
OLMo:真正的完全开源大模型
OLMo(Open Language Model)与其他开源语言模型的不同之处在于其“完全开放的框架”。 OLMo不仅100%开放了其完整的预训练数据——3万亿token的Dolma数据集 还提...
AI数字人活了?一张照片就能唱歌和说话,表情动作自然!Emo AI带你进入未来的艺术世界
AI新技术:Emo AI让照片唱歌和说话 什么是Emo AI? Emo AI是一个新兴的人工智能项目,它能够让任何一张照片具备唱歌和说话的能力。这项技术通过给定的照片...
EMO: 激活表情肖像视频的生成 – 在弱条件下利用Audio2Video扩散模型
作者:Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo 机构:阿里巴巴集团智能计算研究院 概述 我们提出了EMO,一个表情丰富的音频驱动的肖像视频生成框...
中国版Sora横评:字节CapCut AI Video领跑,创企展现实力!
中国版Sora横评:字节CapCut AI Video领跑,创企展现实力! 概述 2024年3月1日报道,距离OpenAI发布Sora已经过去十几天,中国版Sora的表现受到广泛关注...
剪映AI绘图应用Dreamina:张楠的野心与努力!
引言 近日,剪映AI绘图应用Dreamina上线网页端,标志着张楠全心投入剪映的成长与突破。剪映在AI领域的努力是认真的。然而,Dreamina被指与国内AIGC初创公司T...
Playground v2.5 介绍,领先开源模型,探索文本到图片生成的新境界!
Playground v2.5 介绍,领先开源模型,探索文本到图片生成的新境界! 什么是Playground v2.5? Playground v2.5 是最新的文本到图片生成模型,它是目前开源...
Google AI工具Gemini的问题和修复
Gemini的问题 Gemini是Google最近推出的一个AI工具,它可以回答文本形式的问题,也可以根据文本提示生成图片。然而,Gemini的一些回答和生成的图片引发了争...
PIKA上线唇形同步:AI视频的新突破,让人物真实对话!
PIKA上线唇形同步:AI视频的新突破,让人物真实对话! PIKA的更新动态 PIKA在沉寂了3个月后,终于又更新了。他们没有去追求模型的更新,或者控制的优化,而...
AI突破:成功预测核聚变等离子体撕裂,迈向无限清洁能源
可控核聚变在解决未来能源危机方面扮演着至关重要的角色,它被誉为清洁能源的「圣杯」。然而,等离子体不稳定性长期以来一直是困扰核聚变实现的一大难题。最...
Stable Diffusion 3来啦!文本理解更好,图像质量更强,AI算力消耗更低,推理速度更快!
简介 Stable Diffusion 3是由stability.ai开放社区在2022年2月23日推出的新版本。这个版本相比于Stable Diffusion 2在文本语义理解、色彩饱和度、图像构图、...