保姆级教程：在Firefly RK3588开发板上搞定YOLOv5+DeepSORT目标追踪（附完整环境配置与避坑指南）

张

张建站

2026/5/6 12:49:27

10分钟阅读

保姆级教程：在Firefly RK3588开发板上搞定YOLOv5+DeepSORT目标追踪（附完整环境配置与避坑指南）

保姆级教程在Firefly RK3588开发板上部署YOLOv5DeepSORT目标追踪系统当一块Firefly RK3588开发板握在手中时许多开发者脑海中浮现的第一个应用场景往往是实时目标检测与追踪。这个六核ARM处理器与NPU结合的硬件平台确实为边缘计算提供了绝佳的试验场。但真正着手部署YOLOv5和DeepSORT这套经典组合时你会发现从环境配置到模型优化的每一步都可能成为拦路虎。本文将带你避开所有暗礁用最直接的方式在RK3588上构建一个高效的目标追踪系统。1. 开发板基础环境准备刚拿到开发板时建议先执行全面的系统更新。RK3588的Ubuntu系统虽然预装了不少工具但仍需要补充关键组件sudo apt update sudo apt upgrade -y sudo apt install -y git cmake python3-dev python3-pip特别注意开发板的存储空间有限建议使用外接SSD或扩容存储。以下命令可以查看存储情况df -h提示如果用户目录空间不足可以考虑将大型源码包和编译目录放在外接存储设备上通过符号链接关联到工作目录。基础开发工具链安装完成后需要配置Python虚拟环境。RK3588的ARM架构对某些Python包存在兼容性要求python3 -m venv ~/venv_rk3588 source ~/venv_rk3588/bin/activate pip install --upgrade pip setuptools wheel2. 关键依赖库的编译与安装2.1 FFmpeg的定制化编译视频处理是目标追踪的基础而FFmpeg的版本兼容性直接影响后续OpenCV的功能。推荐从源码编译FFmpeg 4.4版本wget https://ffmpeg.org/releases/ffmpeg-4.4.tar.bz2 tar xvjf ffmpeg-4.4.tar.bz2 cd ffmpeg-4.4编译配置时需要特别注意硬件加速选项./configure --prefix/usr/local/ffmpeg \ --enable-shared \ --enable-gpl \ --enable-nonfree \ --enable-version3 \ --enable-rkmpp \ --enable-libdrm \ --extra-cflags-I/usr/include/drm \ --extra-ldflags-L/usr/lib/aarch64-linux-gnu make -j6 sudo make install关键参数说明参数作用RK3588特别注意事项--enable-rkmpp启用Rockchip媒体处理平台加速必须开启--enable-libdrm启用DRM显示支持需要安装libdrm-dev-j6并行编译线程数建议不超过6线程2.2 OpenCV 4.7的深度优化编译OpenCV是计算机视觉的核心库RK3588上编译需要特别关注NPU加速支持git clone --branch 4.7.0 https://github.com/opencv/opencv.git git clone --branch 4.7.0 https://github.com/opencv/opencv_contrib.git创建编译目录并配置CMakemkdir build cd build cmake -D CMAKE_BUILD_TYPERELEASE \ -D CMAKE_INSTALL_PREFIX/usr/local/opencv-4.7.0 \ -D OPENCV_EXTRA_MODULES_PATH../../opencv_contrib/modules \ -D WITH_GTKON \ -D WITH_FFMPEGON \ -D ENABLE_NEONON \ -D ENABLE_VFPV3ON \ -D WITH_RKMPPON \ -D BUILD_EXAMPLESOFF \ -D BUILD_opencv_python3ON \ -D PYTHON3_EXECUTABLE$(which python3) \ -D PYTHON3_INCLUDE_DIR$(python3 -c from distutils.sysconfig import get_python_inc; print(get_python_inc())) \ -D PYTHON3_PACKAGES_PATH$(python3 -c from distutils.sysconfig import get_python_lib; print(get_python_lib())) ..编译过程中的常见问题及解决方案内存不足在make命令中添加-j4而非-j6减少并行度找不到RKMPP安装librga-dev和librknn-runtime包Python绑定失败确认Python虚拟环境已激活3. YOLOv5模型转换与优化3.1 模型训练与导出建议先在x86平台上训练YOLOv5s模型然后导出为ONNX格式# 在训练服务器上执行 import torch model torch.hub.load(ultralytics/yolov5, yolov5s, pretrainedTrue) dummy_input torch.randn(1, 3, 640, 640) torch.onnx.export(model, dummy_input, yolov5s.onnx, opset_version12, input_names[images], output_names[output])3.2 RKNN模型转换使用Rockchip提供的RKNN-Toolkit2进行模型转换from rknn.api import RKNN rknn RKNN() rknn.config(target_platformrk3588, quantize_input_nodeTrue, optimization_level3) # 加载ONNX模型 ret rknn.load_onnx(modelyolov5s.onnx) if ret ! 0: print(Load model failed!) exit(ret) # 量化模型 ret rknn.build(do_quantizationTrue, dataset./dataset.txt) if ret ! 0: print(Build model failed!) exit(ret) # 导出RKNN模型 ret rknn.export_rknn(./yolov5s.rknn)关键量化参数建议参数推荐值说明optimization_level3最高优化级别quantize_input_nodeTrue输入节点量化quantized_dtypeasymmetric_quantized-88位非对称量化batch_size1嵌入式部署通常为14. DeepSORT集成与系统调优4.1 特征提取器适配DeepSORT的核心是特征提取网络在RK3588上需要轻量化// 修改特征提取器输入尺寸 const int feature_dim 512; const int feature_width 64; const int feature_height 128; // 使用MobileNetv2替代原版ResNet rknn_input inputs[1]; inputs[0].index 0; inputs[0].size {feature_width, feature_height, 3}; inputs[0].fmt RKNN_TENSOR_NHWC;4.2 多线程流水线设计充分利用RK3588的六核CPU设计处理流水线// 视频捕获线程 std::thread capture_thread([](){ while(!stop_signal) { cv::Mat frame; cap frame; if(frame.empty()) break; mtx.lock(); frame_queue.push(frame); mtx.unlock(); } }); // 检测线程 std::thread detect_thread([](){ while(!stop_signal) { if(!frame_queue.empty()) { mtx.lock(); cv::Mat frame frame_queue.front(); frame_queue.pop(); mtx.unlock(); auto detections yolov5_detect(frame); tracker.update(detections); } } });4.3 内存与性能优化技巧DMA-BUF内存共享减少内存拷贝开销cv::Mat frame(height, width, CV_8UC3, drm_buffer_handle, DRM_MODE_FB_MODIFIERS);NPU温度监控防止过热降频watch -n 1 cat /sys/class/thermal/thermal_zone*/temp优先级调整保证关键线程资源sudo chrt -f 99 ./yolov5_deepsort5. 实际部署与效果验证部署后的系统可以通过V4L2直接获取摄像头输入./yolov5_deepsort -i /dev/video0 -o output.mp4 \ -m yolov5s.rknn \ -c 80 \ -t 0.5性能指标参考值1080p分辨率指标YOLOv5单独运行完整系统帧率22 FPS15 FPSCPU占用180%320%内存占用1.2 GB1.8 GBNPU温度65°C72°C在RK3588上实现稳定运行的关键是找到检测精度与实时性的平衡点。经过实测将YOLOv5的输入尺寸从640x640降至480x480帧率可提升40%而精度仅下降5%。

3分钟学会！摄影师必备的智能批量水印工具终极指南

3分钟学会！摄影师必备的智能批量水印工具终极指南【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为一张张手动添加水印而烦恼吗&a…...

2026/5/6 12:47:28 阅读更多 →

5分钟快速上手：使用memtest_vulkan专业检测GPU显存稳定性

5分钟快速上手：使用memtest_vulkan专业检测GPU显存稳定性【免费下载链接】memtest_vulkan Vulkan compute tool for testing video memory stability 项目地址: https://gitcode.com/gh_mirrors/me/memtest_vulkan 在当今GPU硬件性能日益强大的时代&#xf…...

2026/5/6 12:46:40 阅读更多 →

别再被BigDecimal除法坑了！手把手教你用RoundingMode解决‘无限循环小数’异常

BigDecimal除法陷阱全解析：从异常处理到金融级精度控制实战金融系统里的一分钱差额可能引发连锁反应，而电商平台的促销计算错误则会导致用户投诉——这些场景背后都藏着一个Java开发者共同的"噩梦"：Non-terminating decimal expan…...

2026/5/6 12:42:45 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/5 12:09:26 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/5 13:13:36 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/5 3:26:31 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/5 9:51:58 阅读更多 →