Simon Shi的小站

无人驾驶（11）控制理论

Posted on 2022-04-25 Edited on 2025-08-06 In Autopilot , 入门提高

无人驾驶（12）基于强化学习的自动驾驶系统

Posted on 2022-04-25 Edited on 2025-08-06 In Autopilot , 入门提高

无人驾驶（8）无人车定位系统(SLAM)

Posted on 2022-04-24 Edited on 2025-08-06

Content

[TOC]

定位技术简介

定位+高精度地图:提供当前位置的静态环境感知( 车道线/交通指示牌/红绿灯/柱子/建筑物/等)
定位+动态物体感知:将感知到的动态物体正确放入静态环境
定位获取位置姿态:用于路径规划/决策

定位技术分类

场景：室内（房间，车库，仓库等）室外（）
基于感知模式
- outside-in: 接收的外界信号包含位置相关信息/ GNSS UWB WIFI Lidar Hdmap Camera-marker(室外街景门牌室内 maker)磁条加marker(规划都做了)扫地机本身贴marker加顶部相机 / (适合测量方程)
- inside-out：通过自身观察和感受获取位置信息 / IMU magnetometer SLAM VR中的墙面贴marker建图 / (适合状态方程)
基于计算方法
- 基于信号的定位: GNSS UWB WIFI/几何关系
- 环境特征匹配: Lidar-HDmap Camera-marker Radar / 需要建图，观测特征与数据库的特征匹配得到当前位姿态
- 航迹推算:IMUodometry(轮子里程计/视觉里程计SLAM)/根据之前的位姿推断当前的位姿

定位系统的融合

原理：不同源传感器信息通过滤波器(KF, EKF, UKF, PF等)进行融合
典型融合方式：
- IMU + GNSS :高频率累积误差+低频率高精度无人机/无人车/导弹/室外
- GNSS + Lidar-HDMAP/Camera-marker：适合开放环境+适合密集特征环境无人车/室内外
- VIO(SLAM+IMU+GNSS) 无人机/无人车/室内外
- IMU + magnetometer 矫正角度（互补滤波/MadgwickAHRS）无人机/无人车/室内外

单个定位技术

GNSS

IMU

Lidar / Camera

SLAM

定位融合技术

定位系统的融合

原理：不同源传感器信息通过滤波器(KF, EKF, UKF, PF等)进行融合
典型融合方式：
- IMU + GNSS :高频率累积误差+低频率高精度无人机/无人车/导弹/室外
- GNSS + Lidar-HDMAP/Camera-marker：适合开放环境+适合密集特征环境无人车/室内外
- VIO(SLAM+IMU+GNSS) 无人机/无人车/室内外
- IMU + magnetometer 矫正角度（互补滤波/MadgwickAHRS）无人机/无人车/室内外

Histogram Filter

Apollo定位方案

开源项目

https://gitee.com/paopaoslam/ORB-SLAM2

无人驾驶（7）高精地图V2X HD MAP

Posted on 2022-04-24 Edited on 2025-08-06 In Autopilot , 入门提高

[TOC]

王博Kings：无人驾驶系列知识入门到提高7-高精度地图 V2X HD MAP

CSDN self_drive car_学习笔记–第7课：HD MAP高精地图 & V2X

1. OverView

HD AMP

元素信息
点云信息
HD地图 = 元素地图 + 点云地图

LOCALIZATION

Perception 感知

Planning

Apollo HDMap

SLAM

2. OPENDRIVE 开放协议

制图过程和V2X

3. Cloud Point Mapping

3.1 Lidar & Image

3.2 点云匹配

1）依赖库说明
—-OpenCV3:目前最常用也是用途最广的图像处理依赖库，熟悉基本操作，比如cv::Mat、imread
—-Eigen:C++下最常用的矩阵运算库，类似于Matlab，对矩阵的描述和计算都非常方便，任何计算都是矩阵
—-PCL：Point Cloud Library，点云计算库，方便对点云进行操作和可视化

2）安装方法：
—-Eigen库使用源码拷贝的方式或者apt-get安装
—-Opencv安装可以用ppi源来安装，也可以用源码编译安装
—-在Ubuntu下使用apt-get安装PCL

3）使用说明

代码库：JointMapping
–cmake .
–make
–./joinMap
–pcl_viewer ./map.pcd

3.3 基础概念

相机内参
相机外参
像素坐标系
刚体运动
坐标系转换
旋转坐标
平移坐标
齐次坐标系，变换矩阵
欧拉角
四元数

3.4 相机模型

1）相机成像的原理是针孔相机模型：

—-P表示物理世界中的一个点；P’表示成像中模型中的位置；坐标分别为XYZ和X’Y’Z’
—-相似三角形关系：

2）相机内参
将成像坐标P’切换到像素坐标系中，要进行两步转换：缩放和原点平移
假设P’的像素坐标为[u v]T（表示列矩阵），变换坐标就是：

把这个形式切换到齐次坐标系：

这里的K就是我们说的内参矩阵，也就是每个相机需要校准的内参

3）相机外参
注意一下，这里的P是相机坐标系下的位置，而其世界坐标系下的坐标Pw,可以根据旋转平移来得到：
$$
ZP_{w} = K(RP_w + t) = KTP_{w}
$$

—-这里有齐次变换到非齐次坐标的变换
—-因此，相机姿态R，T（t?是不是指的是上面公式的）又称为相机外参
—-外参会随着车辆移动而移动，因此我们高精地图构建过程中就是需要去估计这个外参，同时也是车辆移动轨迹

4）数据结构
–PGM数据格式：Portable Gray Map,最简单的灰度图数据格式，这里我们拿来表示把点云压成平面的深度信息（0-65535），其中0表示没有检测到深度
–png:RGB信息的常用格式
–pose:5组7状态，txt文档，[x y z qx qy qz qw],平移向量和旋转四元数

5）代码示例：
–根据相机内参计算RGB和点云的对应关系
–根据各图相机外参把点云和RGB融合进行图片融合，构成全局地图

【源码是老师的，没有放到云端，下面就是部分截图，仅供参考】

todo

通过该函数，可以获取得到点云图
【下面偷个小懒，截个图算了，哈哈哈】

OpenCV 练习

4. V2X

UML

Posted on 2022-04-21 Edited on 2025-08-06 In Tools , UML

符号含义

	符号	含义
关联		关联
		关联
		关联
组合		组合（整体与部分，部分不可以脱离整体存在）翅膀-鸟儿
		组合
聚合		聚合（整体与部分，部分可以脱离整体存在）手机–耳机
		聚合
依赖		依赖
继承		继承
继承		继承

无人驾驶（5）动态环境感知与3D目标检测

Posted on 2022-04-18 Edited on 2025-08-06 In Autopilot , 入门提高

[TOC]

5.1 基于激光雷达点云的检测算法 (3D检测)

激光雷达点云简介
Pixel-Based
Voxel-Based
Tree-Based
Point-Based
实战基于点云的目标检测

0、激光雷达点云简介

什么是激光雷电点云？

常用数据集

KITTI 实战kitti LIDAR点云生成鸟瞰图BEV

点云基础 - 将点云投影到图片上

BEV: 俯视图
- https://blog.csdn.net/w1995s/article/details/114841920
Lidar Point on Image

传统VS深度学习

1、基于像素的点云算法（Pixel-Based）

基本思想：
- 3D-2D, 三维点云在不同角度的相机投影（映射）
- 再借助2D图像处理领域成熟的深度学习框架进行分析
典型算法
- MVCNN, MV3D, AVOD
- Apollo2.0 SequeezeSeg

MVCNN (分类)

MV3D

AVOD

Feature Extractor

RPN

Apollo2.0

SqueezeSeg

代码实战：[tolearning]

无人驾驶汽车系统入门（二十六）——基于深度学习的实时激光雷达点云目标检测及ROS实现

Ubuntu16.04运行SqueezeSeg_Ros

2、基于体素的点云算法（Voxel-Based）

VoxNet

VoxelNet

= Voxel-Based + Point-Based (局部+全局)

3、基于树的点云算法（Tree-Based）

OctNet

O-CNN

Escape from Cells

4、基于点的点云算法（Point-Based）

对称函数、X变换

PointNet （CVPR2017）

1x3的卷积，实现全连接层

transform_net

PointNet++ (NIPS2017)

PointCNN

核心：X卷积

Frustum-Pointnet

PointRCNN

5.2 Voxelnet

代码结构

效果：

Onnx Model inference by C++

Posted on 2022-04-15 Edited on 2025-08-06 In AI , deploy , Onnx

[TOC]

0. onnx模型准备以及测试图

1. c++使用onnxruntime进行推理

#include <opencv2/core.hpp>
#include <opencv2/imgcodecs.hpp>
#include <opencv2/opencv.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc_c.h>
#include <opencv2/dnn.hpp>
#include <iostream>  
#include <onnxruntime_cxx_api.h>
#include <assert.h>
#include <vector>
#include <fstream>


using namespace cv;     //当定义这一行后，cv::imread可以直接写成imread
using namespace std;
using namespace Ort;
using namespace cv::dnn;

String labels_txt_file = "F:\\Pycharm\\PyCharm_Study\\Others\\c++_learning\\C++_Master\\Onnx\\classification\\classification_classes_ILSVRC2012.txt";
vector<String> readClassNames();                  // string对象作为vector对象 

// 图像处理  标准化处理
void PreProcess(const Mat& image, Mat& image_blob)
{
    Mat input;
    image.copyTo(input);


    //数据处理 标准化
    std::vector<Mat> channels, channel_p;
    split(input, channels);
    Mat R, G, B;
    B = channels.at(0);
    G = channels.at(1);
    R = channels.at(2);

    B = (B / 255. - 0.406) / 0.225;
    G = (G / 255. - 0.456) / 0.224;
    R = (R / 255. - 0.485) / 0.229;

    channel_p.push_back(R);
    channel_p.push_back(G);
    channel_p.push_back(B);

    Mat outt;
    merge(channel_p, outt);
    image_blob = outt;
}


// 读取txt文件
std::vector<String> readClassNames()
{
    std::vector<String> classNames;

    std::ifstream fp(labels_txt_file);
    if (!fp.is_open())
    {
        printf("could not open file...\n");
        exit(-1);
    }
    std::string name;
    while (!fp.eof())
    {
        std::getline(fp, name);
        if (name.length())
            classNames.push_back(name);
    }
    fp.close();
    return classNames;
}



int main()         // 返回值为整型带参的main函数. 函数体内使用或不使用argc和argv都可
{

    //environment （设置为VERBOSE（ORT_LOGGING_LEVEL_VERBOSE）时，方便控制台输出时看到是使用了cpu还是gpu执行）
    Ort::Env env(ORT_LOGGING_LEVEL_WARNING, "OnnxModel");
    Ort::SessionOptions session_options;
    // 使用1个线程执行op,若想提升速度，增加线程数
    session_options.SetIntraOpNumThreads(1);
    CUDA加速开启(由于onnxruntime的版本太高，无cuda_provider_factory.h的头文件，加速可以使用onnxruntime V1.8的版本)
    //OrtSessionOptionsAppendExecutionProvider_CUDA(session_options, 0);
    // ORT_ENABLE_ALL: 启用所有可能的优化
    session_options.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL);

    //load  model and creat session

#ifdef _WIN32
    const wchar_t* model_path = L"F:\\Pycharm\\PyCharm_Study\\Others\\c++_learning\\C++_Master\\Onnx\\classification\\vgg16.onnx";
#else
    const char* model_path = "F:\\Pycharm\\PyCharm_Study\\Others\\c++_learning\\C++_Master\\Onnx\\classification\\vgg16.onnx";
#endif

    printf("Using Onnxruntime C++ API\n");
    Ort::Session session(env, model_path, session_options);
    // print model input layer (node names, types, shape etc.)
    Ort::AllocatorWithDefaultOptions allocator;


    //model info
    // 获得模型又多少个输入和输出，一般是指对应网络层的数目
    // 一般输入只有图像的话input_nodes为1
    size_t num_input_nodes = session.GetInputCount();
    // 如果是多输出网络，就会是对应输出的数目
    size_t num_output_nodes = session.GetOutputCount();
    printf("Number of inputs = %zu\n", num_input_nodes);
    printf("Number of output = %zu\n", num_output_nodes);
    //获取输入name
    const char* input_name = session.GetInputName(0, allocator);               
    std::cout << "input_name:" << input_name << std::endl;
    //获取输出name
    const char* output_name = session.GetOutputName(0, allocator);
    std::cout << "output_name: " << output_name << std::endl;
    // 自动获取维度数量
    auto input_dims = session.GetInputTypeInfo(0).GetTensorTypeAndShapeInfo().GetShape();
    auto output_dims = session.GetOutputTypeInfo(0).GetTensorTypeAndShapeInfo().GetShape();
    std::cout << "input_dims:" << input_dims[0] << std::endl;
    std::cout << "output_dims:" << output_dims[0] << std::endl;    
    std::vector<const char*> input_names{ input_name };
    std::vector<const char*> output_names = { output_name };
    std::vector<const char*> input_node_names = { "input.1" };
    std::vector<const char*> output_node_names = { "70"};


    //加载图片
    Mat img = imread("F:\\Pycharm\\PyCharm_Study\\Others\\c++_learning\\C++_Master\\Onnx\\classification\\dog.jpg");
    Mat det1, det2;
    resize(img, det1, Size(256, 256), INTER_AREA);
    det1.convertTo(det1, CV_32FC3);
    PreProcess(det1, det2);         //标准化处理
    Mat blob = dnn::blobFromImage(det2, 1., Size(224, 224), Scalar(0, 0, 0), false, true);
    printf("Load success!\n");

    clock_t startTime, endTime;
    //创建输入tensor
    auto memory_info = Ort::MemoryInfo::CreateCpu(OrtAllocatorType::OrtArenaAllocator, OrtMemType::OrtMemTypeDefault);
    std::vector<Ort::Value> input_tensors;
    input_tensors.emplace_back(Ort::Value::CreateTensor<float>(memory_info, blob.ptr<float>(), blob.total(), input_dims.data(), input_dims.size()));
    /*cout << int(input_dims.size()) << endl;*/
    startTime = clock();

    推理(score model & input tensor, get back output tensor)
    auto output_tensors = session.Run(Ort::RunOptions{ nullptr }, input_node_names.data(), input_tensors.data(), input_names.size(), output_node_names.data(), output_node_names.size());
    endTime = clock();
    assert(output_tensors.size() == 1 && output_tensors.front().IsTensor());
    //除了第一个节点外，其他参数与原网络对应不上程序就会无法执行
    //第二个参数代表输入节点的名称集合
    //第四个参数1代表输入层的数目
    //第五个参数代表输出节点的名称集合
    //最后一个参数代表输出节点的数目
      获取输出(Get pointer to output tensor float values)
    float* floatarr = output_tensors[0].GetTensorMutableData<float>();     // 也可以使用output_tensors.front(); 获取list中的第一个元素变量  list.pop_front(); 删除list中的第一个位置的元素
    // 得到最可能分类输出
    Mat newarr = Mat_<double>(1, 1000); //定义一个1*1000的矩阵
    for (int i = 0; i < newarr.rows; i++)
    {
        for (int j = 0; j < newarr.cols; j++) //矩阵列数循环
        {
            newarr.at<double>(i, j) = floatarr[j];
        }
    }
    /*cout << newarr.size() << endl;*/

    vector<String> labels = readClassNames();
    for (int n = 0; n < newarr.rows; n++) {
        Point classNumber;
        double classProb;
        Mat probMat = newarr(Rect(0, n, 1000, 1)).clone();
        Mat result = probMat.reshape(1, 1);
        minMaxLoc(result, NULL, &classProb, NULL, &classNumber);
        int classidx = classNumber.x;
        printf("\n current image classification : %s, possible : %.2f\n", labels.at(classidx).c_str(), classProb);

        // 显示文本
        putText(img, labels.at(classidx), Point(10, 20), FONT_HERSHEY_SIMPLEX, 0.6, Scalar(0, 0, 255), 1, 1);
        imshow("Image Classification", img);
        waitKey(0);
    }

     计算运行时间
    std::cout << "The run time is:" << (double)(endTime - startTime) / CLOCKS_PER_SEC << "s" << std::endl;
    printf("Done!\n");
    system("pause");
    return 0;
}

参考资料

Install ONNX Runtime (ORT)

C++使用onnxruntime/opencv对onnx模型进行推理(附代码)

在C++上利用onnxruntime （CUDA）和 opencv 部署模型onnx

无人驾驶（6）动态环境感知与跟踪

Posted on 2022-04-12 Edited on 2025-08-06 In Autopilot , 入门提高

[TOC]

单目跟踪算法：

产生式
鉴别式
基于相关滤波
基于深度学习

6.1 什么是跟踪？

6.2 单目标跟踪

6.2.1 单目标跟踪-产生式模型

Kalman Filter

code: https://github.com/andylei77/kalman_particle_demo

N(均值，协方差)

Particle Filter

6.2.2 单目标跟踪-鉴别式模型

Boosting

MIL

MEDIANFLOW

TLD

跟踪器：光流
检测器：

OPENCV API

code: https://github.com/andylei77/learnopencv/tree/master/tracking

6.2.3 单目标跟踪-基于相关滤波算法

-

MOSSE 评价相似性的滤波算法

CSK

CSK方法
- 密集采样，通过循环矩阵来实现
- 分类器的学习通过快速傅里叶变换成频域内的计算，不受SVM或Boost等学习方法的限制(什么限制？？)。无论线性分类还是核分类，整个学习过程十分高效。
实时性好

MOSSE

KCF

循环矩阵
循环矩阵傅里叶对角化性质–简化计算加速分类器的学习过程
基于HOG特征的分类器（DeepSRDCF：深度学习提取的特征+KCF方法）

GOTURN （深度学习）

https://www.learnopencv.com/goturn-deep-learning-based-object-tracking/

算法综述

数据集；深度学习CNN；CF-相关滤波；其它的

6.3 多目标跟踪

分类方法

按照轨迹形成的时间顺序
- 在线
- 离线
按照算法机制
- 预测校正 / 关联方式
按照算法的数学表示
- 概率统计最大化 / 确定性推导

Hungarian Algorithm

https://github.com/andylei77/HungarianAlgorithm

实战

发送端：https://github.com/andylei77/object-detector/tree/ROS

基于二分图匹配的多目标跟踪

接受端：https://github.com/andylei77/object-tracker/tree/master/tracker

深度学习编译器之TVM

Posted on 2022-04-12 Edited on 2025-08-06 In AI , deploy , TVM

TVM

[TOC]

训练框架

从训练框架角度来看，Google的TensorFlow和FaceBook的Pytorch是全球主流的深度学习框架，另外亚马逊的MxNet，百度的Paddle，旷视的MegEngine，华为的Mindspore以及一流科技的OneFlow也逐渐在被更多人接受和使用。这么多训练框架，我们究竟应该选择哪个？如果追求易用性，可能你会选择Pytorch，如果追求项目部署落地，可能你会选择TensorFlow，如果追求分布式训练最快可能你会体验OneFlow。

亚马逊的MxNet，

百度的Paddle，

旷视的MegEngine，

华为的Mindspore

ModelScope：阿里达摩院联手中国计算机学会（CCF）

推理框架

前向推理框架，例如在Intel的CPU/GPU上就使用OpenVINO，在Arm的CPU/GPU上使用NCNN/MNN等，在Nvidia GPU上使用TensorRT。

科学家为编译器抽象出了编译器前端，编译器中端，编译器后端等概念，并引入IR (Intermediate Representation)的概率。解释如下：

编译器前端：接收C/C++/Java等不同语言，进行代码生成，吐出IR
编译器中端：接收IR，进行不同编译器后端可以共享的优化，如常量替换，死代码消除，循环优化等，吐出优化后的IR
编译器后端：接收优化后的IR，进行不同硬件的平台相关优化与硬件指令生成，吐出目标文件以LLVM编译器为例子，借用蓝色（知乎ID）大佬的图：

深度学习的IR其实就是计算图，所以可以直接叫作Graph IR

基于上面深度学习编译器的思想，陈天奇领衔的TVM横空出世。TVM就是一个基于编译优化的深度学习推理框架（暂且说是推理吧，训练功能似乎也开始探索和接入了），我们来看一下TVM的架构图。

TVM架构图从这个图中我们可以看到，TVM架构的核心部分就是NNVM编译器（注意一下最新的TVM已经将NNVM升级为了Realy，所以后面提到的Relay也可以看作是NNVM）。NNVM编译器支持直接接收深度学习框架的模型，如TensorFlow/Pytorch/Caffe/MxNet等，同时也支持一些模型的中间格式如ONNX、CoreML。这些模型被NNVM直接编译成Graph IR，然后这些Graph IR被再次优化，吐出优化后的Graph IR，最后对于不同的后端这些Graph IR都会被编译为特定后端可以识别的机器码完成模型推理。比如对于CPU，NNVM就吐出LLVM可以识别的IR，再通过LLVM编译器编译为机器码到CPU上执行。

0x04. 样例展示

在展示样例前说一下我的环境配置，pytorch1.7.0 && TVM 0.8.dev0

这里以Pytorch模型为例，展示一下TVM是如何将Pytorch模型通过Relay（可以理解为NNVM的升级版，）构建TVM中的计算图并进行图优化，最后再通过LLVM编译到Intel CPU上进行执行。最后我们还对比了一下基于TVM优化后的Relay Graph推理速度和直接使用Pytorch模型进行推理的速度。这里是以torchvision中的ResNet18为例子，结果如下：

1 2	Relay top-1 id: 282, classname: tiger cat Torch top-1 id: 282, classname: tiger cat Relay time: 1.1846002000000027 seconds Torch time: 2.4181047000000007 seconds

可以看到在预测结果完全一致的情况下，TVM能带来2倍左右的加速。这里简单介绍一下代码的流程。这个代码可以在这里(https://github.com/BBuf/tvm_learn)找到。

0x04.1 导入TVM和Pytorch并加载ResNet18模型

import time
import tvm
from tvm import relay
import numpy as np
from tvm.contrib.download import download_testdata
# PyTorch imports
import torch
import torchvision
################################ Load a pretrained PyTorch model
# -------------------------------
model_name = "resnet18"
model = getattr(torchvision.models, model_name)(pretrained=True)
model = model.eval()
# We grab the TorchScripted model via tracing
input_shape = [1, 3, 224, 224]
input_data = torch.randn(input_shape)
scripted_model = torch.jit.trace(model, input_data).eval() 

需要注意的是Relay在解析Pytorch模型的时候是解析TorchScript格式的模型，所以这里使用torch.jit.trace跑一遍原始的Pytorch模型并导出TorchScript模型。

0x04.2 载入测试图片

加载一张测试图片，并执行一些后处理过程。

from PIL import Image
img_url = "https://github.com/dmlc/mxnet.js/blob/main/data/cat.png?raw=true"
img_path = download_testdata(img_url, "cat.png", module="data")
img = Image.open(img_path).resize((224, 224))
# Preprocess the image and convert to tensor
from torchvision import transforms 
my_preprocess = transforms.Compose( 
        [ transforms.Resize(256), 
         transforms.CenterCrop(224), 
         transforms.ToTensor(), 
         transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]), ])
img = my_preprocess(img)
# 新增Batch维度
img = np.expand_dims(img, 0)

0x04.3 Relay导入TorchScript模型并编译到LLVM后端

接下来我们将PyTorch的graph导入到Relay成为Relay Graph，这里输入层的名字可以任意指定。然后将Gpath使用给定的配置编译到LLVM目标硬件上。

参考资料

「TVM系列教程一」深度学习编译器及TVM 介绍

OCR

Posted on 2022-04-12 Edited on 2025-08-06 In AI , OCR

GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

Install

1	pip install easyocr

usage

1
2
3

import easyocr
reader = easyocr.Reader(['ch_sim','en']) # this needs to run only once to load the model into memory
result = reader.readtext('chinese.jpg')

定位技术简介

单个定位技术

GNSS

IMU

Lidar / Camera

SLAM

定位融合技术

Histogram Filter

Apollo定位方案

开源项目

1. OverView

HD AMP

HD Map VS Navigation Map

LOCALIZATION

Perception 感知

Planning

Apollo HDMap

SLAM

2. OPENDRIVE 开放协议

3. Cloud Point Mapping

3.1 Lidar & Image

3.2 点云匹配

3.3 基础概念

3.4 相机模型

OpenCV 练习

4. V2X

符号含义

5.1 基于激光雷达点云的检测算法 (3D检测)

0、激光雷达点云简介

什么是激光雷电点云？

常用数据集

KITTI 实战kitti LIDAR点云生成鸟瞰图BEV

点云基础 - 将点云投影到图片上

传统VS深度学习

1、基于像素的点云算法（Pixel-Based）

MVCNN (分类)

MV3D

AVOD

Apollo2.0

SqueezeSeg

代码实战：[tolearning]

2、基于体素的点云算法（Voxel-Based）

VoxNet

VoxelNet

3、基于树的点云算法（Tree-Based）

OctNet

O-CNN

Escape from Cells

4、基于点的点云算法（Point-Based）

PointNet （CVPR2017）

PointNet++ (NIPS2017)

PointCNN

Frustum-Pointnet

PointRCNN

5.2 Voxelnet

代码结构

相关资料

0. onnx模型准备以及测试图

1. c++使用onnxruntime进行推理

参考资料

6.1 什么是跟踪？

6.2 单目标跟踪

6.2.1 单目标跟踪-产生式模型

Kalman Filter

Particle Filter

6.2.2 单目标跟踪-鉴别式模型

Boosting

MIL

MEDIANFLOW

TLD

6.2.3 单目标跟踪-基于相关滤波算法

CSK

MOSSE

KCF

GOTURN （深度学习）

算法综述

6.3 多目标跟踪

Hungarian Algorithm

实战

训练框架