作品简介

本书由浅入深地介绍了如何将深度学习技术应用到移动端运算领域,书中尽量避免罗列公式,尝试用浅显的语言和几何图形去解释相关内容。本书第1章展示了在移动端应用深度学习技术的Demo,帮助读者建立直观的认识;第2章至第4章讲述了如何在移动端项目中应用深度学习技术;第5章至第8章的难度略大,主要讲述如何深入地调整框架,适配并定制自己的框架。本书适合移动端研发工程师阅读,也适合所有对移动端运算领域感兴趣的朋友阅读。

李永会,百度App移动研发部资深工程师。2015年起在百度从事图像搜索和语音搜索客户端研发工作,主持了多个重要创新项目,包括百度Lens、实时翻译等。同时负责开源移动端深度学习框架Paddle-Lite的开发,长期从事移动端AI高性能计算优化工作,在多种软硬件平台上高性能运行深度学习技术。在工作之余有读史、书法等爱好。

作品目录

  • 内容简介
  • 推荐序一
  • 推荐序二
  • 前言
  • 读者服务
  • 第1章 初窥移动端深度学习技术的应用
  • 1.1 本书示例代码简介
  • 1.2 移动端主体检测和分类
  • 1.3 在线上产品中以“云+端计算”的方式应用深度学习技术
  • 1.4 在移动端应用深度学习技术的业界案例
  • 1.5 在移动端应用深度学习技术的难点
  • 1.6 编译运行深度学习App
  • 1.7 在iOS平台上搭建深度学习框架
  • 1.8 在Android平台上搭建深度学习框架
  • 第2章 以几何方式理解线性代数基础知识
  • 2.1 线性代数基础
  • 2.2 向量的几何意义
  • 2.3 线性组合的几何意义
  • 2.4 线性空间
  • 2.5 矩阵和变换
  • 2.6 矩阵乘法
  • 2.7 行列式
  • 2.8 矩阵的逆
  • 2.9 秩
  • 2.10 零空间
  • 2.11 点积和叉积的几何表示与含义
  • 2.12 线性代数的特征概念
  • 2.13 抽象向量空间
  • 第3章 什么是机器学习和卷积神经网络
  • 3.1 移动端机器学习的全过程
  • 3.2 预测过程
  • 3.3 数学表达
  • 3.4 神经元和神经网络
  • 3.5 卷积神经网络
  • 3.6 图像卷积效果
  • 3.7 卷积后的图片效果
  • 3.8 卷积相关的两个重要概念:padding和stride
  • 3.9 卷积后的降维操作:池化
  • 3.10 卷积的重要性
  • 第4章 移动端常见网络结构
  • 4.1 早期的卷积神经网络
  • 4.2 AlexNet网络结构
  • 4.3 GoogLeNet网络结构
  • 4.4 尝试在App中运行GoogLeNet
  • 4.5 轻量化模型SqueezeNet
  • 4.6 轻量高性能的MobileNet
  • 4.7 移动端神经网络模型的优化方向
  • 第5章 ARM CPU组成
  • 5.1 现代计算机与ARM CPU架构的现状
  • 5.2 简单的CPU模型
  • 5.3 汇编指令初探
  • 5.4 汇编指令概况
  • 5.5 ARM指令集架构
  • 5.6 ARM手机芯片的现状与格局
  • 第6章 存储金字塔与ARM汇编
  • 6.1 ARM CPU的完整结构
  • 6.2 存储设备的金字塔结构
  • 6.3 ARM芯片的缓存设计原理
  • 6.4 ARM汇编知识
  • 6.5 NEON汇编指令
  • 第7章 移动端CPU预测性能优化
  • 7.1 工具及体积优化
  • 7.2 CPU高性能通用优化
  • 7.3 卷积性能优化方式
  • 7.4 开发问题与经验总结
  • 第8章 移动端GPU编程及深度学习框架落地实践
  • 8.1 异构计算编程框架OpenCL
  • 8.2 移动端视觉搜索研发
  • 8.3 解决历史问题:研发Paddle-Lite框架
展开全部