多模态模型
主要介绍多模态模型(VLM)的示例 demo 使用。
📄️ InternVL2_5-1B
此文档讲解如何在安装了瑞莎智核 AX-M1 的 host 设备上运行 InternVL25-1B 示例应用。
📄️ InternVL3-2B
此文档讲解如何在安装了瑞莎智核 AX-M1 的 host 设备上运行 InternVL3-2B 示例应用,关于模型转换请参考 这里
📄️ YOLO-World-V2
此文档讲解如何在安装了瑞莎智核 AX-M1 的 host 设备上运行 YOLO-World-V2 示例应用。
📄️ Qwen2.5-VL-3B-Instruct
此文档讲解如何在安装了瑞莎智核 AX-M1 的 host 设备上运行 Qwen2.5-VL-3B-Instruct 示例应用。
📄️ Qwen3.5
Qwen3.5 是阿里云通义实验室于 26年2月份 发布的原生多模态大模型,采用混合架构(线性注意力 + MoE),总参数量 3970 亿、激活 170 亿参数,支持 201 种语言,在推理、编程、智能体能力与多模态理解方面表现优异。
📄️ Qwen3-VL-2B-Instruct
本文档演示如何在瑞莎 AX-M1 上运行 Qwen3-VL-2B-Instruct 模型: