计算机视觉
一、计算机视觉简介
定义:用计算机模拟人类的视觉系统,去完成人类的视觉任务
基本任务:图像分类 目标检测与定位 语义分割和实例分割
图像分类:对图像进行分类
语义分割:对每个像素点进行分类且不区分相同类别的个体
分类+定位:单目标检测
目标检测:多个目标的分类与定位
实例分割:实例分割是一个与目标检测密切相关的概念。但是,与目标检测不同,输出是包含对象的掩码(或轮廓),而不是包围框。与语义分割不同的是,我们不会标记图像中的每个像素;我们只对寻找特定对象的边界感兴趣
二、图像分类
CV的核心任务:图像分类
计算机的挑战:语义鸿沟 尺度差异 视觉差异 类内差异
交叉验证是个不错的选择,对于大型数据集和深度学习较少使用
数据驱动的算法
KNN
优点:简单
缺点:1.不具有泛化能力 2.像素距离 $\ne$语义距离 3. 训练即需要均匀分布,否则导致curse of dimensionality
曼哈顿距离:两点之间的x和y距离
欧式距离:两点之间的距离
Linear classifier
线性分类器很难适用于的数据分布:离散象限 1<L2距离<2 孤岛数据