目标检测速成计划总纲-基础知识模型架构数据处理模型优化应用部署AIOT竞赛成长
目录
目标检测速成计划总纲 : 基础知识、模型架构、数据处理、模型优化、应用部署、AIOT、竞赛成长
目录
- 2.1 R-CNN系列
- 2.2 YOLO系列
- 2.3 除R-CNN外其他二阶段
- 2.4 除YOLO外其他一阶段
- 2.5 其他
- 【OpenCV】
- 【RKNN3399】
- 【Jetson Nano】
0. ML&DL基础理论
0.1 编程语言基础
0.1.1 python
0.1.2 c++
0.2 数据结构与算法
0.2.1 python数据机构与算法分析
0.2.2 剑指offer
0.2.3 leetcode 300
0.3 机器学习&深度学习基础
0.3.1 统计学习与方法
0.3.2 动手学深度学习
0.4 各种评价指标
0.4.1 AP ,可以参见
1. 目标检测基础内容
【目标检测20年】 |
1.1 目标检测近年里程碑
上图,回顾近20年来的图像检测和识别的历史,可以发现,目标检测的实现,已经从传统的图像技术 逐渐进入深度学习驱使和全面应用。从最早的闻名于耳的
SIFT
、
HOG
,已经逐渐演变成
anchor free & anchor based
的深度学习范式。尤其是
AlexNet
在一骑绝尘夺冠之后,将深度学习应用到目标检测领域成为大家竞相开展的学术热点。
2019年的一篇survey的历史图 (下载地址参见 reference1) ,综述了近20年的目标检测和识别的发展史。作者将算法大致分为2012年之前的传统检测方法与2012年之后出现的基于深度学习的检测方法。
传统方法比如我们所熟知的V-J检测、HOG检测、DPM算法。
深度学习方法截然不同的分为两条技术路径:单阶段检测算法与两阶段检测算法。
同时作者把目标检测的一些精度提高的方法的出现也列在了时间轴上,比如bounding box regression、multi-resolution detection等。
调查中也象征性列举了,各个代表作在不同数据集上的精度情况:
1.2 知名数据集简介
1.3 深度学习目标检测名篇速查
来自首尔国立大学的 Lee hoseong 开源了 「deep learning object detection」 GitHub 项目,列举了近些年来深度学习-目标检测重要论文。其他论文可参考上图。后续我也会逐渐在本专栏详细描述。
项目链接是:
1.4 常见GPU环境搭建
linux服务器:
ubuntu pc:
win10 pc:
1.5 基础图像理论和常见框架使用教程
1.5.1 图像基础和OpenCV
1.5.2 keras + tf1.x 教程
1.5.3 pytorch教程
1.5.4 opencv c++教程
2. 目标检测论文精读
【目标检测经典论文解读】 |
2.1 R-CNN系列
(1) R-CNN灵感来源:Selective search for object recognition
(2) R-CNN开山之篇:R-CNN
(3) R-CNN起承转合之笔:Fast R-CNN
(4) R-CNN完全深度学习大成篇:Faster R-CNN
2.2 YOLO系列
(5)YOLO系列最快的仔:YOLO V1
(6)YOLO系列重要续作:YOLO V2
(5)YOLO系列原创性idea里程碑:YOLO V3
(6)YOLO官方交接之棒:YOLO V4:
(7)YOLO非官方异军突起、更新超快的"杂牌军":非官方版本的"YOLO V5":
2.3 除R-CNN外其他二阶段
2.4 除YOLO外其他一阶段
2.5 其他
(8)SPP-Net
(9)Attention-Net
(10)SSD
(11)R-FCN
(12)SSP-Net
(13)FPN
(14)RetinaNet
(15)SSP-Net
(16)Mask R-CNN
(17)Cascade RCNN
(18)Refine Net
(19)RFB Net
(20)M2Net
3. 数据下载和处理
【数据下载】 |
3.1 原始图片下载方法和标注
3.2 原始视频下载方法和视频截取
3.3 常见CV Database
【常见CV Database汇总】
| | |
相关的主干目录和内容,参见如下:
1.目标识别知名数据集
1.1 PASCAL VOC
1.2 MS COCO
1.3 ImageNet
2 人脸识别相关
2.1 FERET人脸数据库
2.2 CMU Multi-PIE人脸数据库
2.3 年龄识别数据集IMDB-WIKI
2.4 Large-scale CelebFaces Attributes (CelebA) Dataset
2.5 Labeled Faces in the Wild Home (LFW)
2.6 CeFA
2.7 WildestFaces
3 skyimg.ai 发布的相关图像数据集的整理
4 CVonline: Image Databases
行动数据库
属性识别
自动驾驶
生物/医学
摄像机校准
事件摄像机数据
人脸和眼睛/虹膜数据库
指纹
一般图像
常规RGBD、三维点云和深度数据集
一般视频
手、手抓握、手动作和手势数据库
图像、视频和形状数据库检索
对象数据库
人(静态和动态),人体姿势
人员检测和跟踪数据库(另见监控)
遥感
机器人学
场景或场所,场景分割或分类
分割
同时定位和绘图
监视和跟踪(另见人员)
纹理
城市数据集
视觉与自然语言
杂项主题
5 汇总几个下载一般数据集的常用网站
5.1、Kaggle数据集
5.2、Amazon数据集
5.3、UCI机器学习资源库
5.4、谷歌数据集搜索引擎
5.5、微软数据集
5.6、Awesome Public Datasets Collection
5.7、政府数据集
5.8、计算机视觉数据集
5.9 阿里天池
5.10 格物钛
6 其他网友整理的数据合集
包括了视频、音频、NLP 、CV、 金融、交通、医疗、社会数据等多方面。
7 部分数据交易平台
【数据转换和标准格式生成】 |
3.4 VOC自动标注工具
3.5 CV常见数据格式转换
【数据处理】 |
3.6 VOC数据异常检测
3.7 VOC数据可视化
【数据增广】 |
3.8 VOC物理改变增广(旋转、尺度、hsv等)
3.9 GAN系列方法数据增广(gan, stylegan等)
4.模型转化和测试
【各个框架模型转化】 |
4.1 keras, pytorch, tensorflow, caffe模型转化
【模型测试】 |
4.2 常见模型测试脚本范例(pic / video)
4.3 mAP / 0.5@mAP / ROC / inference time /
5.模型优化
【模型速度优化】 |
5.1 模型量化、剪枝
5.2 tensorRT
【模型平台优化】 |
5.3 CPU加速
5.4 ncnn
【模型精度优化】 |