作品简介

如何保证大模型输出内容的可靠性?

如何建立自然语言和形式逻辑之间的映射?

如何在工业级应用中将自然语言查询自动转换为SQL语言?

如何由浅入深地实现一个知识图谱问答系统?

如何使用预训练技术提高模型语义理解的能力?

如何通过数据增强的方法提升语义解析的效果?

在实际产品中如何应用语义解析技术?

以上所有问题都能在本书中找到答案!

语义解析技术能解决大模型无法保证输出的形式语言可靠性和输出答案真实性的问题。本书由语义解析大赛获奖者撰写,通过本书的学习,读者可以了解NLP的相关技术,掌握自然语言生成SQL和知识图谱问答的实现方法。

本书从逻辑上分为三部分。

第一部分(第1章):从具体的语义解析问题入手,引出了各种主流技术,讨论了不同技术方案的对比和实现路径,并比较了不同数据集和技术路线的实验效果。

第二部分(第2~6章):详细讲解了5种语义解析技术路线,即基于机器翻译、模板填充、强化学习、GNN、中间表达的技术原理与实现示例。

第三部分(第7~11章):讲解了如何从零开始构建一个语义解析系统,并针对NL2SQL和知识图谱问答的不同应用场景提供实践方案。同时,阐述了在产品中落地语义解析技术可能遇到的问题和应对技巧。

易显维:硕士毕业于中国地质大学,曾任职中国建设银行、科大讯飞研究院、百分点认知智能实验室。10余年算法研发经验,在涉及机器学习技术的各个方向均有产品落地实践经验,并长期为武汉各企业的算法研发工作提供咨询与支持。主要研究方向为语义解析、机器视觉、组合导航,在国内外算法竞赛中累计获奖20余次。

宁星星:容联云AI研究院NLP算法专家,华南理工大学硕士。深耕NLP领域,从事语义解析、文本理解、文本校对、大模型(LLM)等方向的研究与应用。曾获CCKS(2020、2022)、百度千言(2022)、WAIC(2022)、CCF-BDCI(2021)、百度AI创新大赛(2021)、NLPCC(2020)等在内的多项Top3竞赛奖项,并参与研发容联云赤兔大模型。

作品目录

  • FOREWORD 序
  • PREFACE 前言
  • CHAPTER1 第1章 NL2SQL和KBQA中的语义解析技术
  • 1.1 人机交互应用与语义解析难点分析
  • 1.2 主流的语义解析技术
  • 1.3 语义解析的预训练模型和数据集
  • 1.4 本章小结
  • CHAPTER2 第2章 基于机器翻译的语义解析技术
  • 2.1 机器翻译原理浅析
  • 2.2 NL2SQL翻译框架的构建
  • 2.3 从序列到集合:SQLNet模型的解决方案
  • 2.4 T5预训练模型在NL2SQL中的应用
  • 2.5 NL2SQL的T5模型实践
  • 2.6 本章小结
  • CHAPTER3 第3章 基于模板填充的语义解析技术
  • 3.1 意图识别和槽位填充
  • 3.2 基于X-SQL的模板定义与子任务分解
  • 3.3 本章小结
  • CHAPTER4 第4章 基于强化学习的语义解析技术
  • 4.1 Seq2Seq中的强化学习知识
  • 4.2 SCST模型
  • 4.3 MAPO模型
  • 4.4 本章小结
  • CHAPTER5 第5章 基于GNN的语义解析技术
  • 5.1 使用GNN对数据库模式进行编码
  • 5.2 关注模式的Global GNN
  • 5.3 关注模式链接的RATSQL
  • 5.4 关注模式链接拓扑结构的LGESQL
  • 5.5 本章小结
  • CHAPTER6 第6章 基于中间表达的语义解析技术
  • 6.1 中间表达:IRNet
  • 6.2 引入中间表达层SemQL
  • 6.3 IRNet代码精析
  • 6.4 本章小结
  • CHAPTER7 第7章 面向无嵌套简单SQL查询的原型系统构建
  • 7.1 语义匹配解决思路
  • 7.2 任务简介
  • 7.3 任务解析
  • 7.4 代码示例
  • 7.5 本章小结
  • CHAPTER8 第8章 面向复杂嵌套SQL查询的原型系统构建
  • 8.1 复杂嵌套SQL查询的难点剖析
  • 8.2 型模型解析
  • 8.3 列模型解析
  • 8.4 值模型解析
  • 8.5 完整系统演示
  • 8.6 本章小结
  • CHAPTER9 第9章 面向SPARQL的原型系统构建
  • 9.1 T5、BART、UniLM模型简介
  • 9.2 T5、BART、UniLM方案
  • 9.3 T5、BART、UniLM生成SPARQL语句实现
  • 9.4 T5、BART、UniLM模型结果合并
  • 9.5 路径排序
  • 9.6 SPARQL语句修正和再次排序
  • 9.7 本章小结
  • CHAPTER10 第10章 预训练优化
  • 10.1 预训练技术的发展
  • 10.2 定制预训练模型:TaBERT
  • 10.3 TAPAS
  • 10.4 GRAPPA
  • 10.5 本章小结
  • CHAPTER11 第11章 语义解析技术落地思考
  • 11.1 研究与落地的差别
  • 11.2 产品视角的考虑
  • 11.3 潜在的落地场景
  • 11.4 实践技巧
  • 11.5 本章小结
  • 推荐阅读
展开全部