RKLLM 安装

RKLLM 简介

RKLLM 可以帮助用户快速将 LLM 模型部署到 Rockchip 芯片中，目前支持芯片：RK3588/RK3576/RK3562 系列芯片。

RKLLM 整体框架如下：

要使用 RKNPU，用户需要先在 x86 工作站上运行 RKLLM-Toolkit 工具，将训练好的模型转换为 RKLLM 格式的模型，然后在开发板上使用 RKLLM C API 进行推理。

克隆 RKLLM 仓库

X86 Linux PC

git clone -b release-v1.2.1b1 https://github.com/airockchip/rknn-llm.git && cd rknn-llm

检查 RKNPU 驱动版本是否大于等于 0.9.8，如小于此版本请下载并烧录最新 radxa 6.1 固件

提示
radxa 6.1 固件默认 RKNPU 驱动版本为 0.9.6，请通过: sudo rsetup -> System -> System Update 升级系统以更新至 0.9.8 RKNPU 驱动。升级后请务必执行 sudo apt autopurge 然后重启。
Radxa OS
$ sudo cat /sys/kernel/debug/rknpu/version RKNPU driver: v0.9.8
（可选）手动编译 NPU 内核

若用户所使用的为非官方固件，需要对内核进行更新；其中，RKNPU 驱动包支持两个主要内核版本：kernel-5.10 和 kernel-6.1；用户可在内核根目录下的 Makefile 中确认具体版本号。内核的具体的更新步骤如下：

1）下载压缩包 rknpu_driver_0.9.8_20241009.tar.bz2。

2）解压该压缩包，将其中的 rknpu 驱动代码覆盖到当前内核代码目录。

3）重新编译内核。

4）将新编译的内核烧录到设备中。
RKLLM Runtime 为 Rockchip NPU 平台提供 C/C++ 编程接口，帮助用户部署 RKLLM 模型，加速 LLM 应用的实现。在板端克隆 RKLLM 仓库。
Radxa OS
git clone -b release-v1.2.1b1 https://github.com/airockchip/rknn-llm.git