面向计算机视觉的基础库,支持 Linux、Windows 以及 MacOS 平台。它提供了众多功能,包括基于 PyTorch 的通用训练框架、高质量实现的常见 CUDA 算子、通用的 IO 接口、图像和视频处理、图像和标注结果可视化、多种 CNN 网络结构等功能、常用小工具(进度条,计时器等)。
基于 PyTorch 和 MMCV 的通用目标检测平台。支撑了 3D 目标检测、旋转框检测、场景文字识别、姿态估计、目标跟踪等算法库中检测算法的实现;支持 2D 目标检测、实例分割、全景分割任务;支持算法多样,涵盖了单阶段、双阶段和级联模型等各任务中的典型算法和各类训练技术;为通用目标检测算法的研发提供了高性能基准
课堂专注度及考试作弊系统、课堂动态点名。情绪识别、表情识别、姿态识别和人脸识别结合
基于 PyTorch 和 MMCV 的视频理解工具库,支持动作识别、动作定位、时空动作检测和骨骼动作识别等多种任务。
双目深度估计、三维重建、立体视觉、双目视觉 Stereo Algorithms (Include:CREStereo,RAFT-Stereo,Hitnet,Stereo Transformers,RealtimeStereo,DistDepth) with TensorRT,ORT,OpenVINO
Tensorflow implementation of the paper "Efficient Deep Learning for Stereo Matching"
基于 PyTorch 的视频目标感知开源工具箱,同时支持视频目标检测、多目标跟踪、单目标跟踪和视频实例分割等多种任务、学术数据集和算法。