PyTorch版的YOLOv5是高性能的实时目标检测方法。 TensorRT是针对NVIDIA的GPU加速工具。TensorRT是NVIDIA 推出的一款基于CUDA和cudnn的神经网络推断加速引擎,可提高了深度学习模型在边缘设备上的推理速度。 在计算资源并不丰富的嵌入式设备上,TensorRT之所以能加速神经网络的的推理主要得益于两点。首先是TensorRT支持INT8和FP16的计算,通过在减少计算量和保持精度之间达到一个理想的trade-off,达到加速推断的目的。更为重要的是TensorRT对于网络结构进行了重构和优化。
课程内容包括:原理篇(YOLOv5网络架构与组件、TensorRT基础、TensorRT INT8量化、tensorrtx介绍、CUDA编程方法)、实践篇(Ubuntu和Windows10系统上的TensorRT部署演示)、代码解析篇(YOLOv5的TensorRT加速的代码解析) 。
本课程提供注释后的YOLOv5的TensorRT加速代码下载(百度网盘和谷歌网盘)。
【相关课程】
本人推出了有关YOLOv5目标检测的系列课程。请持续关注该系列的其它视频课程,包括:
《YOLOv5目标检测实战:训练自己的数据集》
《YOLOv5目标检测:原理与源码解析》
《YOLOv5目标检测实战:Flask Web部署》
《YOLOv5目标检测实战:TensorRT加速部署》
《YOLOv5目标检测实战:Jetson Nano部署》
《YOLOv5实战口罩佩戴检测》
《YOLOv5实战交通标志识别》
《YOLOv5实战垃圾分类目标检测》
《YOLOv5+DeepSORT多目标跟踪与计数精讲》