blog | 第88页 | 学AI很简单-易之网

OpenAI 连续 12 天 AI 发布会：第六天详解 – 视频功能加入高级语音模式

为什么 OpenAI 要推出视频功能？ OpenAI 在连续 12 天的 AI 发布会第六天，宣布为 ChatGPT 的高级语音模式加入视频功能和屏幕共享。这标志着 ChatGPT 从纯文本和语...

AI前沿 # AI # ChatGPT # openai

1年前

21,1580

可灵 AI 模型功能详解：打造高仿真数字分身

什么是可灵 AI 模型？ #AI模型 #可灵 #功能特点可灵 AI 模型是一种先进的人工智能模型，它能够根据用户提供的图像或视频数据，创建出高度逼真的数字分身。这个数字分身不仅在外观上与用户高度...

AI前沿 # AI # AI模型 # sora

1年前

24,7590

微软发布 Phi-4：小模型，大能量，如何实现超越？

什么是 Phi-4？为什么值得关注？微软最新发布了 Phi-4，这是一个拥有 140亿参数的小型语言模型。你可能会觉得 140 亿参数不算什么，毕竟现在动辄几千亿甚至上万亿参数的模型比比皆是。但 ...

AI前沿 # AI发展 # 人工智能未来 # 参数优化

1年前

23,2780

Google 与三星联合开发的 VR 头显：Android XR 的全新体验

什么是 Android XR？它如何改变 VR 体验？ Android XR 是一个由 Google 和三星联合开发的全新 VR 操作系统。它基于 Android 系统，目标是让现有的 Andro...

AI前沿 # AndroidXR # GeminiAI # Google

1年前

15,1980

HelloMeme ComfyUI V2 最新更新详解：表情一致性、姿态驱动与性能全面提升

什么是 HelloMeme ComfyUI V2？ HelloMeme 是一个基于 ComfyUI 的项目，专注于提升视频生成质量，特别是人物表情和姿态的自然度。最新发布的 V2 版本带来了多项重大...

AI前沿 # AI工具 # AI视频生成 # COMFYUI

1年前

31,0000

HelloMeme：Runway Act-1 的开源平替，让静态照片“动起来”？

什么是 HelloMeme？它能做什么？ HelloMeme 是一款新兴的开源工具，它最核心的功能就是能让静态照片“活起来”。具体来说，你只需要提供一张静态照片和一个驱动视频，HelloMeme 就能...

AI前沿 # AI工具 # HelloMeme # RunwayActOne

7个月前

27,2540

TEN：一个实时语音AI智能体开源框架？

TEN是什么？它能做什么？ TEN，全称 TEN-Agent，是一个开源的实时语音AI智能体框架。简单来说，它就像一个乐高积木，你可以用它快速搭建一个能和你用语音对话的AI助手。这个助手不仅能听懂你说...

AI前沿 # AI工具 # 人文关怀 # 发展趋势

1年前

49,4050

字节跳动“即梦”图像文字生成能力：海报设计师的未来？

字节跳动“即梦”的图像文字生成能力有多强？ “即梦”的惊人表现：文字与图像的完美融合最近，字节跳动的“即梦”图像生成工具展示了其强大的图像文字生成能力，引起了广泛关注。一位名为“小互”的用户分享了使...

AI前沿 # AI绘图 # Jellycat风格 # 即梦

1年前

19,9600

Devin：认知型AI工程师正式亮相，助力开发者高效工作

什么是 Devin？它与之前的宣传有何不同？最近，一款名为 Devin 的认知型AI工程师正式推出，引起了广泛关注。这款产品由 Cognition 公司开发，旨在通过人工智能技术辅助开发者提高工...

AI前沿 # AI工程师 # api # Cognition

1年前

15,8060

Gemini 2.0 的原生图像生成与可控文本转语音：这意味着什么？

Gemini 2.0 的新特性：原生图像生成和可控文本转语音 1. 什么是原生图像生成？ 1.1 传统图像生成方式的局限性在 Gemini 2.0 之前，很多 AI 模型虽然可以生成图像，但往往需要...

ChatGPT中转API # AI # CHATGPT中转API # Gemini

1年前

23,0870

标签云

智能体