学AI很简单-易之网
标签:MoE
Meta发布Llama 4:模型架构大变,AI战略新方向!
Llama 4 发布:Meta 的 AI 战略新方向? Llama 4 有哪些新特性? Meta 发布了 Llama 4,这次并没有追求参数量的“遥遥领先”,而是通过三款模型来重新布局,...
苹果AirPods大升级:相机加持,感知世界,智能生活新体验!
AI早报 2025年03月11日 苹果正在开发带相机的新款AirPods,内置镜头可感知周围环境,提供植物、动物信息及活动日程提取功能。 智元机器人推出GO-1通用具...
DeepSeek开源:高效MoE通信利器 – DeepEP加速专家并行!
DeepSeek 开源 DeepEP:混合专家模型(MoE)的高效通信利器 什么是 DeepEP?为何要关注它? DeepEP 是 DeepSeek 专门为混合专家模型 (MoE) 和专家并行 (EP)...
DeepSeek王炸开源!AI界三体技术DeepEP榨干GPU性能再突破!
DeepSeek开源DeepEP:AI界的“三体科技”,再次榨干GPU性能 DeepSeek开源DeepEP到底是什么?有哪些技术亮点? 近日,DeepSeek公司开源了一个名为DeepEP的项目...
DeepSeek V3 预览版发布:更强大的 AI 模型来了!
什么是 DeepSeek V3? DeepSeek V3 是 DeepSeek AI 最新发布的 大型语言模型 预览版,它在 参数量、架构、性能 和 功能 上都进行了显著提升。 我们可以把它...
DeepSeek-V3重磅开源!性能对标GPT-4o,本地部署,免费用!
DeepSeek-V3 模型重磅发布:性能对标 GPT-4o,开源可本地部署! 🚀 DeepSeek-V3 究竟是什么?有哪些亮点? DeepSeek-V3 是 深势科技 最新推出的 自研 MoE ...
DeepSeek-VL2:MoE架构加持,视觉模型迎来全能升级!
DeepSeek-VL2:视觉模型迈入 MoE 时代,能力全面升级! 为什么 DeepSeek-VL2 值得关注? DeepSeek-VL2 历经九个月的等待终于发布,它不仅采用了 MoE(Mixtu...