开源

多模态模型-中国视觉模型-中国

Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型，具有32亿参数，在图像理解、数学推理和文本生成等任务中表现出色

Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型，具有32亿参...

多模态模型-全球

Reka Flash 3是一个新发布的多模态语言模型，具有21亿参数，专为高效推理和生成而设计

Reka Flash 3是一个新发布的多模态语言模型，具有21亿参数，专为高效推...

视频大模型-中国

Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型，能够基于文本描述和图像输入生成最长102帧的视频

Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型，能够基于...

语言大模型-全球

EXAONE Deep是由LG AI Research推出的一系列推理增强语言模型，旨在提升在数学、科学和编程等领域的推理能力

EXAONE Deep是由LG AI Research推出的一系列推理增强语言模...

多模态模型-全球

Mistral Small 3.1 是由法国初创公司 Mistral AI 发布的一款开源多模态人工智能模型，具有240亿参数，支持文本和图像的处理

Mistral Small 3.1 是由法国初创公司 Mistral AI 发布...

语言大模型-全球

Command A 是一种大型语言模型，具有1110亿个参数，专为需要快速、安全和高质量AI解决方案的企业优化

Command A 是一种大型语言模型，具有1110亿个参数，专为需要快速、安全...

多模态模型-全球

Gemma 3是谷歌发布的最新开放语言模型，具有多模态能力，能够处理文本和图像，支持超过140种语言

Gemma 3是谷歌发布的最新开放语言模型，具有多模态能力，能够处理文本和图像，...

语言大模型-全球

Jamba 1.6是由AI21 Labs推出的一款新型开放模型，旨在为私营企业提供高效的AI解决方案

Jamba 1.6是由AI21 Labs推出的一款新型开放模型，旨在为私营企业提...

视频大模型-中国

HunyuanVideo-I2V是腾讯开源的一种先进的图像到视频生成框架，旨在将静态图像转换为动态视频内容

HunyuanVideo-I2V是腾讯开源的一种先进的图像到视频生成框架，旨在将...

多模态模型-全球视觉模型-全球

Aya Vision是Cohere For AI推出的一系列先进视觉语言模型（VLMs），旨在解决多模态AI系统中的多语言性能挑战

Aya Vision是Cohere For AI推出的一系列先进视觉语言模型（V...

图像大模型-全球

CogView-4是首个支持生成汉字的开源文本到图像（text-to-image）模型

CogView-4是首个支持生成汉字的开源文本到图像（text-to-image...

视频大模型-中国

Wan2.1是阿里云最近发布的开源视频生成模型，具有显著的性能优势，能够在个人电脑上运行，支持多种视频生成任务

Wan2.1是阿里云最近发布的开源视频生成模型，具有显著的性能优势，能够在个人电...