阿里巴巴发布了新的推理模型QwQ-32B,该模型在数学和编程能力上表现出色,并与DeepSeek R1性能相当。
北京硅基流动科技有限公司致力于打造高效、低成本的生成式AI计算基础设施,提供包括模型云平台、推理引擎和加速库等产品,助力用户高效部署AI模型。
MinerU 是一个由上海人工智能实验室开发的开源工具,专注于高效解析和提取复杂PDF文档内容,并将其转换为易于分析的Markdown格式,适用于学术、法律、财务等多个领域。
豆包PixelDance模型是一款AI视频生成大模型,AI视频生成能力秒杀sora!!
CogVideoX-Fun模型是一个先进的视频生成模型。最初,这款模型逐渐发展,从2B版本升级到了最新的**5B版本**。它的进步主要体现在**性能和效果**的飞跃上。
Pixtral 12B** 是 Mistral AI 推出的首款多模态大模型,具备处理图像和文本的能力。
Qwen2-VL 是阿里巴巴达摩院开源的一款先进的视觉多模态 AI 模型,它在图像和视频理解方面展现了卓越的能力。
H2O-Danube3是一款由H2O.ai开发的高效开源小型语言模型,支持离线应用,适合移动设备上的自然语言处理任务。
Dolphin-2.9.1-Mixtral-1x22b是由Cognitive Computations开发的高性能文本生成与对话模型,适用于多种应用场景,但需用户自行负责内容合规性。
豆包大模型是字节跳动开发的一系列多功能人工智能模型,以其高效处理能力和极具竞争力的价格优势,广泛应用于多个领域,推动了人工智能技术的发展。
混元-DiT:高性能细粒度中文理解,多分辨率扩散Transformer模型
Cohere发布Command R+:支持中文,1040亿参数,性能媲美GPT-4
DeepSeek-V2不只是一款模型,它是通往更智能世界的钥匙。它以更低的成本,更高的性能,开启了 AI 应用的新篇章。DeepSeek-V2 的开源,是对这一信念的最好证明,它将激发更多人的创新精神,共同推动人类智能的未来。
快速上手使用大型语言模型。运行Llama 3、Phi 3、Mistral、Gemma等模型。定制和创建您自己的模型。
阿里EMO模型:创造极致真实的肖像视频,开创内容创作新纪元
meta正式发布了Llama3的正式版,模型已经上架,8B和70B模型已经开源,可以免费商用(限制月活不的超越7亿)
谷歌推出的新一代轻量级开放模型
>LangGPT:面向大语言模型的自然语言编程框架,一句话创建高质量提示词prompt模版。
OpenAI推出的AI文本到视频生成模型
ModelScope 是由阿里巴巴集团推出的一个AI模型平台。这个平台汇聚了阿里巴巴在人工智能领域的技术积累,致力于为研究人员、开发者和企业提供服务。
AnyText图像多语言视觉文本生成与编辑
介绍 介绍 CogAgent...
论文阅读、润色和写作,一键Python与C++项目解析项目
MagicAnimate是由新加坡国立大学Show Lab和字节跳动的研究人员开发的尖端人类图像动画框架。
FaceFusion的基本功能跟roop类似,因为它的跟Roop是同一个作者制作的。下一代换脸器和增强器。
Langchain是基于Langchain思想的本地知识库问答应用。它旨在构建一个支持中文场景和开源模型的离线运行的知识库问答解决方案。
Stability AI的Generative Models是一种由Stability AI开发的生成模型。生成模型是一类机器学习模型,可以通过学习现有数据的分布特征来生成新的数据样本,如图像、音频、文本等。Stability AI的Generative Models具有高度的模块化性和配置驱动的特点,可以根据需求构建各种类型的生成模型,并提供相应的训练、推理和评估功能。这些模型可以应用于多个领域,如图像生成、自然语言处理和音频合成等。
一篇关于Latent Consistency Models (LCMs)的论文的摘要和相关信息。这篇论文介绍了LCMs作为在Latent Diffusion Models (LDMs)之后的新一代生成模型,旨在克服LDM的慢速迭代采样过程,在任何预训练的LDMs(例如Stable Diffusion)上进行快速推断。
Whisper是OpenAI公司开发的一种通用语音识别模型,它是基于大量不同音频数据集进行训练的。Whisper模型是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别等任务。
百川大模型-汇聚世界知识 创作妙笔生花-百川智能