蚂蚁百灵大模型全面升级多模态能力 什么是多模态能力? 多模态能力是指大模型能够理解和处理多种类型的数据,包括音频、视频、图像和文本等。这种能力使得大模型更像人一样感知和互动,支撑智能体体验升级。 蚂蚁百灵大模型的多模态能力有哪些应用... AI前沿 1年前12,4380
蚂蚁集团推出百灵大模型,提升多模态处理能力应用 蚂蚁集团近日宣布了其百灵大模型的最新进展。百灵大模型以其原生多模态能力而闻名,能够直接理解并训练音频、视频、图像、文本等多种数据类型。这一突破性的技术现已应用于支付宝智能助理,并计划在更多智能体中推广... AI前沿 1年前103,1900
WhatsApp 将推出生成式 AI 头像功能,提升个性化用户体验 WhatsApp 正准备推出一项新的生成式 AI 功能,允许用户创建类似于苹果 Image Playground 的新形象。这一功能将使用户能够在这一流行的消息应用程序中创建自己的 AI 头像。 这一... AI前沿 1年前12,6940
OccFusion:斯坦福大学开发的高保真度人体形态渲染新方法 斯坦福大学最近开发了一种名为OccFusion的新方法,该方法能够渲染出即使部分被遮挡的完整人体形态。这一技术通过结合3D高斯分片和2D扩散模型监督,实现了高效且高保真度的渲染效果。 OccFusio... AI前沿 1年前10,3100
Stability AI发布Stable Diffusion 3 Medium:商业化许可门槛降低,助力中小企业和个人开发者创新 Stability AI最近修改了其社区许可协议,发布了新的文生图模型Stable Diffusion 3 Medium(SD3-M)。这一模型的重要更新之一是允许其用于商业化用途。具体来说,如果企业... AI前沿 1年前12,9080
阿里巴巴发布“追星星的 AI”:关爱孤独症儿童的创新绘本工具 阿里巴巴推出“追星星的 AI”——关爱孤独症儿童的创新绘本工具 近日,阿里巴巴通义 App 上线了一款名为“追星星的 AI”的特殊 AI 工具。作为国内首个专门为孤独症儿童设计的 AI 绘本工具,“追... AI前沿 1年前15,4510
智谱AI发布CodeGeeX第四代模型:领先的全能代码生成大模型 智谱AI最近发布了CodeGeeX第四代模型,这是一个拥有10亿参数以下、性能领先且全能的代码生成大模型。该模型对个人用户免费,新版本插件v2.12.0已经全面接入,提供更快的代码生成速度和创新功能... AI前沿 1年前13,6880
LivePortrait:让静态肖像动起来的黑科技 LivePortrait:让静态肖像动起来的黑科技 什么是LivePortrait? LivePortrait听起来就像是魔法,但它其实是现实世界中的黑科技。想象一下,你那尘封已久的相册里,那些定格在... AI前沿 1年前21,6660
VSCode代码阅读神器正式发布! VS Code扩展:高效代码阅读与转换工具 1. 一键添加注释功能 1.1 为什么需要一键添加注释功能? 在阅读代码时,我们常常会遇到没有注释的代码,尤其是那些复杂的代码,让人难以理解。这时,一键添加... AI前沿# keywords# VSCode扩展# 代码转换 1年前26,3980
Solos AirGo Vision智能眼镜:将双眼升级为超能力的智能穿戴设备 Solos公司最近推出了一款令人兴奋的新产品——Solos AirGo Vision智能眼镜。这款眼镜集成了先进的ChatGPT-4o可穿戴人工智能系统,为用户提供了超能力般的体验。 Solos Ai... AI前沿 1年前14,0230