跳到主要内容

介绍

硬件

Genio 概念

NIO 12L 使用的 SoC 是 Genio 1200,Genio 是联发科(Mediatek)用于物联网平台的 SoC 系列名称。

Genio 1200 结构

Genio 1200 可用于 AI 加速的硬件:

硬件型号说明
GPUArm Mali-G57 MC5提供浮点模型加速
NPU2xMDLA2.0 + 2xVP6神经网络处理单元

NPU 是 MDLA 和 VPU 的统称。NPU 内部分为大中小规模的核心,这种异构设计提供了对各种类型 AI 的支持。

MDLA 说明

MDLA 全称是 Mediatek Deep Learning Accelerator,即深度学习加速器。主要用于卷积神经网络加速。

限制说明

MDLA2.0 不支持循环神经网络及基于 Transformer 的生成式大模型。

部署

总览

Genio AI 软件栈支持分析式 AI 和生成式 AI,均使用 host-device 的架构,即在主机上转换量化模型,然后在设备上运行处理好的模型。

AI 软件栈总览

两种模式

设备上运行的推理模式分为 onlineoffline 两种:

模式推理框架模型格式
online通用 AI 框架(TFlite、ONNX)tflite、onnx
offlineNeuron Runtimedla

核心区别在于是否需要在设备端配置通用 AI 框架的推理解析工具。两种模式都需要配置 NPU 的 Neuron Runtime,因为通用 AI 框架的推理解析工具在调用 NPU 时也是通过 Neuron Runtime 调用的。

online 模式

该模式适合模型能够高效利用异构框架的场景。

分析式 AI - online 模式硬件调度

框架支持的硬件
ONNX RuntimeCPU、NPU
TFlite InterpreterCPU、GPU、NPU

针对 tflite 格式的模型,联发科提供了专用的转换工具 NeuroPilot Converter,对硬件加速更友好。

生成式 AI

限制

目前只有 offline 模式,仅用于教学目的。Genio 1200 暂不支持生成式 AI。

生成式 AI 部署流程
  1. 通过 mtk_llm_sdk 工具量化模型
  2. post_training_quantize 工具转换为 tflite 格式
  3. 用 NeuroPilot Converter 转换为 dla 格式
  4. 编译为可执行程序,推送到设备端执行
  5. 设备端通过 Neuron Runtime 在 NPU 上运行

软件栈

NeuroPilot

NeuroPilot(NP)是联发科用于 AI 开发的工具、文档、运行时及接口集合。

版本说明

对于一个 SoC,生命周期能使用的 NP 版本是固定的,因为硬件在设计之初支持的算子类型已经固定。

  • MDLA2.0 的 2.0 标识了它的版本号
  • NP 的版本需要和 MDLA 硬件的版本匹配

Genio 1200 支持情况

功能支持状态
分析式 AI (online)TFlite ✅ / ONNX ❌
分析式 AI (offline)
生成式 AI

    您需要登录 GitHub 才能发表评论。如果您已登录,请忽略此消息。

    Radxa-docs © 2026 by Radxa Computer (Shenzhen) Co.,Ltd. is licensed under CC BY 4.0