跳到主要内容

性能基准测试

Benchmark 是了解硬件平台网络模型运行速度的最佳途径。

信息

基准测试结果可能因具体应用场景和模型优化程度而有所不同,仅供参考

测试说明

  • 测试工具:axcl_run_model
  • Batch Size:1 or 8
  • 单位:FPS(Frame/Second)
信息

由于不同 Host 其 memcopy、pcie 性能差异,因此 axcl_run_model 只统计网络模型在 Device 上的推理耗时

视觉模型

视觉模型输入尺寸单张推理 (次/秒)八张并行推理 (次/秒)
Inceptionv122410732494
Inceptionv3224478702
MobileNetv122415084854
MobileNetv222413665073
ResNet1822410662254
ResNet502245761045
SqueezeNet1122415605961
Swin-T224342507
ViT-B/16224162207
YOLOv5s640326394
YOLOv6s640282322
YOLOv8s640248279
YOLOv9s640237
YOLOv10s640298
YOLOv11n640860
YOLOv11s640305
YOLOv11m640114
YOLOv11l64087
YOLOv11x64041

音频模型

音频模型实时因子
Whisper-Tiny0.03
Whisper-Small0.18
MeloTTS0.04

大语言模型

大语言模型提示长度(词元数)首字延迟 (毫秒)生成速度 (词元数/秒)
Qwen2.5-0.5B12818828

视觉语言模型

视觉语言模型输入尺寸图像编码器耗时 (毫秒)提示长度(词元数)首字延迟 (毫秒)生成速度 (词元数/秒)
InternVL2-1B448*448420032042529

    您需要登录 GitHub 才能发表评论。如果您已登录,请忽略此消息。

    Radxa-docs © 2026 by Radxa Computer (Shenzhen) Co.,Ltd. is licensed under CC BY 4.0