计算机视觉

计算机视觉课程前两章总结

Posted by jinaoliu on March 28, 2023

计算机视觉

一、计算机视觉简介

定义:用计算机模拟人类的视觉系统,去完成人类的视觉任务

基本任务:图像分类 目标检测与定位 语义分割和实例分割

图像分类:对图像进行分类

语义分割:对每个像素点进行分类且不区分相同类别的个体

分类+定位:单目标检测

目标检测:多个目标的分类与定位

实例分割:实例分割是一个与目标检测密切相关的概念。但是,与目标检测不同,输出是包含对象的掩码(或轮廓),而不是包围框。与语义分割不同的是,我们不会标记图像中的每个像素;我们只对寻找特定对象的边界感兴趣

二、图像分类

CV的核心任务:图像分类

计算机的挑战:语义鸿沟 尺度差异 视觉差异 类内差异

交叉验证是个不错的选择,对于大型数据集和深度学习较少使用

数据驱动的算法

KNN

优点:简单

缺点:1.不具有泛化能力 2.像素距离 $\ne$语义距离 3. 训练即需要均匀分布,否则导致curse of dimensionality

曼哈顿距离:两点之间的x和y距离

欧式距离:两点之间的距离

Linear classifier

线性分类器很难适用于的数据分布:离散象限 1<L2距离<2 孤岛数据