目录

图像形成与计算机视觉基础

图像形成与计算机视觉基础

https://i-blog.csdnimg.cn/direct/47f669ab49eb4b33885b0a31deb524b4.png

1. 图像形成的基本原理

图像形成是物理世界与传感器(如胶片、CCD/CMOS)交互的过程,核心是光线的传播与记录。

1.1 直接放置胶片模型
  • 物理原理 :物体表面反射的光线直接照射到胶片上,但无任何遮挡或聚焦机制。
  • 问题 :所有物体点的光线会覆盖整个胶片,导致完全模糊(如图1)。
  • https://i-blog.csdnimg.cn/direct/5b16327e27ef4c22ae069f55fc073c8b.png
1.2 针孔相机模型
  • 改进 :在物体与胶片间加入针孔屏障,仅允许通过小孔的光线到达胶片(图2)。

  • 关键参数

    • 孔径大小(d) :孔径越小,成像越清晰但亮度越低(需权衡信噪比)。
    • 焦距(f) :针孔到胶片的距离,决定成像比例。

https://i-blog.csdnimg.cn/direct/b083fa028e5c4546b87a943b4d1146f5.png

1.3 透镜模型
  • 原理 :透镜通过折射集中光线,替代针孔以提高亮度(图3)。

  • 薄透镜公式

    1/f=1/u+1/v​

    • u:物距(物体到透镜的距离)
    • v:像距(透镜到成像平面的距离)
  • 景深(Depth of Field) :透镜允许一定范围内的物体清晰成像,与光圈大小成反比。

2. 投影几何与数学模型

2.1 透视投影(Perspective Projection)

https://i-blog.csdnimg.cn/direct/1775ea833b6e4cde9c061aa08eb88506.png

2.2 仿射投影(Affine Projection)

https://i-blog.csdnimg.cn/direct/40c85169ffde46cbb157f20f222371d4.png

2.3 消失点与消失线

https://i-blog.csdnimg.cn/direct/797ffec511464872a9407f1988657152.png

3. 颜色空间与模型

3.1 RGB颜色空间
  • 定义 :通过红、绿、蓝三原色的叠加表示颜色(图6)。

  • 缺点

    • 通道强相关 :调整亮度需同时改变所有通道。
    • 非线性感知 :人眼对亮度的响应接近对数尺度,而RGB是线性的。
3.2 HSV/HSL颜色空间
  • 组成

    • H(色相) :颜色类型(0°-360°)。
    • S(饱和度) :颜色纯度(0%-100%)。
    • V(明度)/L(亮度) :颜色明暗程度。
  • 应用 :图像编辑软件(如Photoshop)中的颜色选择器。

3.3 YCbCr颜色空间
  • 分离亮度与色度

    • Y(亮度) :Y=0.299R+0.587G+0.114B
    • Cb(蓝色色差) :Cb=0.564(B−Y)+128
    • Cr(红色色差) :Cr=0.713(R−Y)+128
  • 压缩优势 :人眼对亮度更敏感,可对Cb/Cr进行子采样(如4:2:0)。

3.4 CIELAB颜色空间

https://i-blog.csdnimg.cn/direct/e4ffb9c2cc7842f19bb9dd9b9f3671b7.png

4. 数字图像形成技术

4.1 空间采样(Spatial Sampling)
  • 奈奎斯特采样定理 :采样频率需大于信号最高频率的2倍,避免混叠(图7)。

    • 示例 :若图像最高空间频率为100 cycles/mm,则采样间隔需小于0.005 mm。
  • 像素阵列

    x=j⋅Δx,y=k⋅Δy(j,k 为整数)

4.2 量化(Quantization)
  • 位深度与灰度级

    • 8位 :256级(JPEG标准)。
    • 12位 :4096级(医学影像)。
    • 16位 :65536级(专业摄影)。
  • 量化误差

    误差=动态范围2n(n=位深度)

4.3 分辨率与存储权衡
  • 空间分辨率

    • 人脸识别 :64×64像素(约0.1MP)可满足基本需求。
    • 高清显示 :1920×1080像素(2MP)。
  • 存储计算

    单张图像大小=宽×高×通道数×位深度单张图像大小=宽×高×通道数×位深度

    • 示例 :24位彩色图(3通道×8位),1024×768像素:

      1024×768×3×8=18,874,368 bits=2.36 MB

5. 空间域与变换域操作

    • 定义

      • 图像处理 :输入图像 → 输出图像,目标是抑制失真、增强有用信息(如对比度调整、去噪)。
      • 图像分析 :输入图像 → 提取特征/测量(如边缘检测、目标计数)。
      • 计算机视觉 :输入图像 → 语义理解(如目标识别、场景重建)。
    • 空间域操作 :直接在像素值上进行处理,分为两类:

      • 点操作 :单个像素独立变换,公式:

        g(x,y)=T(f(x,y))(如对比度拉伸、反转)g(x,y)=T(f(x,y))(如对比度拉伸、反转)

      • 邻域操作 :基于像素周围区域计算,公式:

        g(x,y)=T(f(x,y),f(x+1,y),f(x−1,y),… )(如均值滤波)g(x,y)=T(f(x,y),f(x+1,y),f(x−1,y),…)(如均值滤波)

6. 点操作详解

6.1 对比度拉伸(Contrast Stretching)

https://i-blog.csdnimg.cn/direct/2228106675d7453c9a3a5a23dae697cb.png

6.2 阈值处理(Thresholding)

https://i-blog.csdnimg.cn/direct/f8d694167f754bfca501cd0f9645b509.png

6.3 强度反转(Intensity Inversion)

https://i-blog.csdnimg.cn/direct/bf33efa2c27745cfaa4957467af1cff0.png

6.4 对数与幂变换

https://i-blog.csdnimg.cn/direct/7d458b3313f04ce8878ad56db2762fb1.png

7. 直方图处理

7.1 直方图均衡化(Histogram Equalization)

https://i-blog.csdnimg.cn/direct/39b503e05dd741d1ac188721aa1f00de.png

7.2 直方图规定(Histogram Matching)

https://i-blog.csdnimg.cn/direct/a9138dc96f71486f8484232d83e7b69d.png

8. 算术与逻辑操作

  • 算术操作

    • 加法 :多幅图像平均降噪(噪声方差降低 σ2NNσ2​)。
    • 减法 :检测变化区域(如运动目标)。
  • 逻辑操作

    • AND/OR :掩膜操作(提取特定区域)。
    • XOR :检测差异(如边缘增强)。

9. 关键问题解析

https://i-blog.csdnimg.cn/direct/8455bcd47b244adfb923cb488c8721c1.png

https://i-blog.csdnimg.cn/direct/f20338e0439a484da07c4efbeb94e99f.png https://i-blog.csdnimg.cn/direct/f8ce57df50874b31894dc933686b1dd0.png

https://i-blog.csdnimg.cn/direct/3df80cf6bf1b433f96347a7a566220ef.png

10. 总结

  • 图像形成 :从物理模型(针孔、透镜)到数学建模(透视/仿射投影)。
  • 颜色科学 :不同颜色空间适应不同需求(编辑、压缩、感知)。
  • 数字化技术 :采样与量化需平衡质量与效率,避免信息损失。
  • 点操作 :直接修改像素值,适合对比度调整和二值化。
  • 直方图处理 :通过分布调整优化全局或局部对比度。
  • 算术操作 :多用于图像融合与噪声抑制。
  • 核心公式与算法 :如Otsu阈值、直方图均衡化需熟练掌握推导与应用。