作品简介

本书是市面上少见的将搜索与深度学习相结合的书,讨论了使用(深度)神经网络来帮助建立有效的搜索引擎的方法。阅读本书无须具备开发搜索引擎的背景,也不需要具备有关机器学习或深度学习的预备知识,因为本书将介绍所有相关的基础知识和实用技巧。书中研究了搜索引擎的几个组成部分,不仅针对它们的工作方式提供了一些见解,还为在不同环境中使用神经网络提供了指导。读完本书,你将深入理解搜索引擎面临的主要挑战、这些挑战的常见解决方法以及深度学习所能提供的帮助。你将清晰地理解几种深度学习技术以及它们在搜索环境中的适用范围,并深入了解Lucene和Deeplearning4j库。书中示例代码用Java编写。

托马索·泰奥菲利(Tommaso Teofili),Red Hat公司高级软件工程师,曾担任Adobe公司软件工程师,对开源和人工智能充满热情。他是Apache软件基金会的成员,参与了许多项目,涉及信息检索、自然语言处理和分布式计算等主题。

译者:李军,电子科技大学计算机应用技术硕士,《IDA Pro代码破解揭密》合作译者,现从事电力系统自动化工作。

天舒,曾就读于四川大学电气工程及自动化专业,英国曼彻斯特大学电力系统工程硕士,现从事电力系统自动化工作。

作品目录

  • 献词
  • 译者序
  • 前言
  • 致谢
  • 关于本书
  • 关于封面图
  • 第一部分 当搜索遇上深度学习
  • 第 1 章 神经搜索
  • 1.1 神经网络及深度学习
  • 1.2 什么是机器学习
  • 1.3 深度学习能为搜索做什么
  • 1.4 学习深度学习的路线图
  • 1.5 检索有用的信息
  • 1.6 未解决的问题
  • 1.7 打开搜索引擎的黑盒子
  • 1.8 利用深度学习解决问题
  • 1.9 索引与神经元
  • 1.10 神经网络训练
  • 1.11 神经搜索的前景
  • 1.12 总结
  • 第 2 章 生成同义词
  • 2.1 同义词扩展介绍
  • 2.2 语境的重要性
  • 2.3 前馈神经网络
  • 2.4 使用word2vec
  • 2.5 评价和比较
  • 2.6 用于生产系统时的考虑
  • 2.7 总结
  • 第二部分 将神经网络用于搜索引擎
  • 第 3 章 从纯检索到文本生成
  • 3.1 信息需求与查询:弥补差距
  • 3.2 学习序列
  • 3.3 循环神经网络
  • 3.4 用于无监督文本生成的LSTM网络
  • 3.5 从无监督文本生成到监督文本生成
  • 3.6 生产系统的考虑因素
  • 3.7 总结
  • 第 4 章 更灵敏的查询建议
  • 4.1 生成查询建议
  • 4.2 Lucene Lookup API
  • 4.3 分析后的建议算法
  • 4.4 使用语言模型
  • 4.5 基于内容的建议算法
  • 4.6 神经语言模型
  • 4.7 基于字符的神经语言建议模型
  • 4.8 调优LSTM语言模型
  • 4.9 使用词嵌入使建议多样化
  • 4.10 总结
  • 第 5 章 用词嵌入对搜索结果排序
  • 5.1 排序的重要性
  • 5.2 检索模型
  • 5.3 神经信息检索
  • 5.4 从单词到文档向量
  • 5.5 评价和比较
  • 5.6 总结
  • 第 6 章 用于排序和推荐的文档嵌入
  • 6.1 从词嵌入到文档嵌入
  • 6.2 在排序中使用段向量
  • 6.3 文档嵌入及相关内容
  • 6.4 总结
  • 第三部分 延伸
  • 第 7 章 跨语言搜索
  • 7.1 为讲多种语言的用户提供服务
  • 7.2 统计机器翻译
  • 7.3 使用并行语料库
  • 7.4 神经机器翻译
  • 7.5 多语言的单词和文档嵌入
  • 7.6 总结
  • 第 8 章 基于内容的图像搜索
  • 8.1 图像内容和搜索
  • 8.2 回顾:基于文本的图像检索
  • 8.3 理解图像
  • 8.4 图像表示的深度学习
  • 8.5 处理未标记的图像
  • 8.6 总结
  • 第 9 章 性能一瞥
  • 9.1 深度学习的性能与约定
  • 9.2 索引和神经元协同工作
  • 9.3 使用数据流
  • 9.4 总结
  • 展望未来
  • 作者简介
  • 看完了
展开全部