作品简介

本书提供了相关工具和算法,能帮助读者实现分析和可视化图像处理。本书给出了60余个具体实例的解决方法,采用“菜谱式”方式组织内容,以期指导读者快速实践图像的分析和可视化处理,应对图像处理中的常见挑战,并学习如何执行复杂的任务,如对象检测、图像分割和使用大型混合数据集的图像重建,以及各种图像增强和图像修复技术,如卡通化、梯度混合和稀疏字典学习。

本书适合计算机视觉工程师、图像处理工程师、软件工程师和机器学习工程师等专业人士阅读,也适合具有一定Python编程基础并希望进一步了解图像处理的细节和复杂性的读者参考。

桑迪潘·戴伊(Sandipan Dey),是一位兴趣广泛的数据科学家,主要研究机器学习、深度学习、图像处理和计算机视觉,曾在推荐系统、行业动态预测模型、传感器定位模型、情感分析和设备预测等众多数据科学领域工作过。桑迪潘·戴伊拥有美国马里兰大学计算机科学硕士学位,在IEEE数据挖掘会议和期刊上发表了数篇学术论文,并在数据科学、机器学习、深度学习、图像处理及相关课程/专业等方面获得了100多个慕课(mooc)学习认证。他经常在博客空间(sandipanweb)撰写博客,是机器学习教育爱好者。

作品目录

  • 版 权 声 明
  • 内 容 提 要
  • 前  言
  • 第1章 图像处理与变换
  • 1.1  技术要求
  • 1.2 变换颜色空间(RGB→Lab)
  • 1.3 应用仿射变换
  • 1.4 应用透视变换和单应性变换
  • 1.5 基于图像创建铅笔草图
  • 1.6 创建卡通图像
  • 1.7 模拟光艺术/长曝光
  • 1.8 在HSV颜色模型中使用颜色进行目标检测
  • 第2章 图像增强
  • 2.1  使用滤波器去除图像中不同类型的噪声
  • 2.2 基于去噪自编码器的图像去噪
  • 2.3 基于PCA/DFT/DWT的图像去噪
  • 2.4 基于各向异性扩散的图像去噪
  • 2.5 利用直方图均衡化改善图像对比度
  • 2.6 执行直方图匹配
  • 2.7 执行梯度融合
  • 2.8 基于Canny、LoG/零交叉以及小波的边缘检测
  • 第3章 图像修复
  • 3.1 使用维纳滤波器来修复图像
  • 3.2 使用约束最小二乘法滤波器来修复图像
  • 3.3 使用马尔可夫随机场来修复图像
  • 3.4 图像修补
  • 3.5 基于深度学习的图像修复
  • 3.6 基于字典学习的图像修复
  • 3.7 使用小波进行图像压缩
  • 3.8 使用隐写术和隐写分析技术
  • 第4章 二值图像处理
  • 4.1 对二值图像应用形态学运算
  • 4.2 应用形态学滤波器
  • 4.3 形态模式匹配
  • 4.4 基于形态学的图像分割
  • 4.5 对象计数
  • 第5章 图像配准
  • 5.1 基于SimpleITK模块的医学图像配准
  • 5.2 使用ECC算法进行图像对齐和变形
  • 5.3 使用dlib库进行人脸对齐
  • 5.4 RANSAC算法的鲁棒匹配和单应性
  • 5.5 图像拼接(全景)
  • 5.6 人脸变形
  • 5.7 实现图像搜索引擎
  • 第6章 图像分割
  • 6.1 使用Otsu和Riddler-Calvard的阈值化进行图像分割
  • 6.2 使用自组织映射进行图像分割
  • 6.3 使用scikit-image进行随机游走图像分割
  • 6.4 使用GMM-EM算法进行人体皮肤的图像分割
  • 6.5 医学图像分割
  • 6.6 深度语义分割
  • 6.7 深度实例分割
  • 第7章 图像分类
  • 7.1 使用scikit-learn库对图像进行分类(方向梯度直方图和逻辑回归)
  • 7.2 使用Gabor滤波器组对纹理进行分类
  • 7.3 使用VGG19/Inception V3/MobileNet/ResNet101(基于PyTorch库)对图像进行分类
  • 7.4 图像分类的微调(使用迁移学习)
  • 7.5 使用深度学习模型对交通标志进行分类(基于PyTorch库)
  • 7.6 使用深度学习实现人体姿势估计
  • 第8章 图像中的目标检测
  • 8.1 基于HOG/SVM的目标检测
  • 8.2 基于YOLO v3的目标检测
  • 8.3 基于Faster R-CNN的目标检测
  • 8.4 基于Mask R-CNN的目标检测
  • 8.5 基于Python-OpenCV的多目标跟踪
  • 8.6 使用EAST/Tesseract来检测/识别图像中的文本
  • 8.7 使用 Viola-Jones/Haar特征进行人脸检测
  • 第9章 人脸识别、图像描述及其他技术
  • 9.1 使用FaceNet进行人脸识别
  • 9.2 使用深度学习模型来识别年龄、性别和情绪
  • 9.3 使用深度学习模型进行图像着色
  • 9.4 使用卷积神经网络和长短期记忆自动生成图像字幕
  • 9.5 使用GAN生成图像
  • 9.6 使用变分自编码器重建并生成图像
  • 9.7 使用受限玻耳兹曼机重建孟加拉语MNIST图像
展开全部