MiniCPM-V 2.6 TPU
MiniCPM-V 2.6 是一款端侧多模态 LLM(MLLM),专为视觉语言理解而设计。MiniCPM-V 2.6 TPU 是使用 Sophon SDK 将 OpenBMB 开源 MiniCPM-V 2.6 多模态语言模型移植到 SG2300X 芯片系列产品上, 使其能利用本地 TPU 进行硬件加速推理,用户可以向其询问一些关于输入图像内容的问题
TPU 设置
TPU 推荐内存设置:NPU->7615MB, VPU->2360MB, VPP->2360MB,如何修改?
应用部署
-
克隆仓库
git clone https://github.com/zifeng-radxa/LLM-TPU.git
-
本案例提供 minicpmv26_bm1684x_int4_seq1024.bmodel 量化模型与 C++ 预编译动态库下载
用户可以参考 MiniCPM-V 2.6 模型转换自行转换不同长度的 MiniCPM-V 2.6 模型
用户可以参考 MiniCPM-V 2.6 cpython 文件编译 自行编译 cpython 接口绑定文件
-
使用 git LFS 从 ModelScope 下载预编译好的 bmodel
cd LLM-TPU/models/MiniCPM-V-2_6/python_demo
git clone https://www.modelscope.cn/radxa/MINICPM-V26_TPU.git
mv MINICPM-V26_TPU/* . -
配置环境