作品简介

医疗大数据是大数据在医疗领域的一个分支,处理的是在与人类健康相关的活动中产生的与生命健康和医疗有关的数据。本书将对医疗大数据进行全面、透彻的分析,从医疗大数据的现状开始,介绍医疗大数据方向的统计、数据挖掘、数据预处理、建模以及可视化等技术与应用。此外,还介绍了医疗领域的图像处理和自然语言处理等人工智能技术。在本书的末尾,还讨论了这个领域普遍关注的一个问题——医疗数据隐私保护,介绍了潜在的隐私风险和隐私保护方法等,并关注了医疗经济的概况与前景。

成生辉博士现任西湖大学未来产业研究中心和工学院研究员,智能可视化实验室负责人。他于纽约州立大学石溪分校获得计算机科学博士学位,曾在美国布鲁克海文国家实验室、哈佛医学院进行研究,并担任世界银行(总部)数字经济组顾问。他的主要研究方向为元宇宙、可视化、可视分析等。他曾任大数据高峰论坛(中国可视化专委会举办)执行主席,国际可视化年会、太平洋可视化大会、中国可视化大会等大会项目委员会委员。发表论文30多篇,出版专著6部,包括《元宇宙:概念、技术及生态》《Web3.0-具有颠覆性与重大机遇的第三代互联网》《中国经济大数据分析》等,入选深圳市和杭州市海外高层次人才,浙江省高校领军人才培养计划。

丁家昕博士是上海交通大学约翰·霍普克罗夫特计算机科学中心副教授,博士生导师,上海交通大学智能物联网研究中心成员。他于纽约州立大学石溪分校获得计算机科学博士学位,并曾在加州大学戴维斯分校计算机系从事博士后研究。他的研究方向包括时空数据挖掘、隐私保护、物联网等,设计了一系列面向物联网大数据的数据挖掘与保护机制,其代表性成果发表在IEEE INFOCOM、IPSN、MobiHoc、SIGSPATIAL、AAAI等国际一流会议与期刊。担任ACM MobiHoc出版主席,IEEE DCOSS程序委员会委员,并于2020年入选上海市青年科技英才扬帆计划。

陈淮教授现为广州医科大学附属第二医院放射科主任,哈佛医学院博士后,博士生导师。主要研究方向为胸部疾病影像诊断、胸部疾病的定量分析,以及通过影像数据和临床信息并结合人工智能技术对疾病进行辅助检测和诊断。承担及参与国家自然基金等各级基金项目10余项,在相关杂志发表论文40余篇。

徐晓音博士现为哈佛医学院布莱根妇女医院放射影像科副教授,博士生导师。他的研究兴趣包括生物信息学、医学影像处理、医学大数据,以及结合影像数据和临床信息并通过计算技术来推动计算机辅助检测和诊断,并在相关杂志和会议上发表了50余篇论文。

作品目录

  • 前言
  • 第1章 医疗大数据概述
  • 1.1 全球大数据现状与特点
  • 1.2 医疗大数据简介
  • 1.3 医疗大数据分析
  • 1.4 医疗大数据产业划分
  • 1.4.1 基础层
  • 1.4.2 数据层
  • 1.4.3 应用层
  • 1.5 医疗大数据的挑战
  • 1.6 大数据在医疗中的实例
  • 参考文献
  • 第2章 数据预处理
  • 2.1 数据清洗
  • 2.1.1 处理缺失值
  • 2.1.2 处理异常值
  • 2.1.3 处理噪声
  • 2.2 大规模计算系统搭建
  • 2.2.1 Hadoop
  • 2.2.2 MapReduce
  • 第3章 统计学在医疗领域的应用
  • 3.1 回归模型
  • 3.1.1 一元线性回归
  • 3.1.2 多元线性回归
  • 3.1.3 逻辑回归
  • 3.2 假设检验
  • 3.2.1 基本步骤
  • 3.2.2 检验方法
  • 3.3 统计软件概述
  • 3.3.1 SPSS
  • 3.3.2 SAS
  • 3.3.3 R
  • 第4章 经典传染病模型
  • 4.1 传染病模型概述
  • 4.1.1 传染病仓室模型
  • 4.1.2 微分方程描述下的传染病仓室模型
  • 4.1.3 传染病仓室模型的简单仿真
  • 4.2 复杂网络传染病模型
  • 4.2.1 网络的基本概念及度量
  • 4.2.2 复杂网络上的传染病模型
  • 参考文献
  • 第5章 医疗数据挖掘
  • 5.1 医疗数据挖掘的应用类型和过程
  • 5.1.1 数据挖掘的应用类型
  • 5.1.2 数据挖掘的过程
  • 5.2 数据挖掘中的常用技术
  • 5.2.1 聚类分析
  • 5.2.2 K-means层次聚类
  • 5.2.3 主成分分析的数据降维
  • 5.2.4 随机邻域嵌入原理及优化
  • 5.2.5 t分布随机邻域嵌入原理及优化
  • 5.2.6 t分布随机邻域嵌入示例
  • 5.3 数据挖掘中需要注意的问题
  • 参考文献
  • 第6章 医疗数据可视化
  • 6.1 数据可视化概述
  • 6.1.1 数据可视化的概念
  • 6.1.2 数据可视化的目的
  • 6.1.3 数据可视化的分类
  • 6.2 医疗数据可视化技术
  • 6.2.1 科学可视化应用
  • 6.2.2 信息可视化应用
  • 参考文献
  • 第7章 大数据和医学影像
  • 7.1 影像大数据中的5个V
  • 7.2 影像数据的使用
  • 7.3 深度学习过程所需的要素
  • 7.4 在医学影像上开展深度学习研究
  • 7.4.1 深度学习的几个步骤
  • 7.4.2 如何衡量深度学习的成功
  • 7.4.3 深度学习在医学影像上的应用
  • 参考文献
  • 第8章 医疗领域的自然语言处理
  • 8.1 自然语言
  • 8.2 自然语言处理概述
  • 8.3 数据集的预处理
  • 8.3.1 句法分析
  • 8.3.2 语义分析
  • 8.4 常见的自然语言处理技术
  • 8.4.1 文本向量化
  • 8.4.2 词云
  • 8.4.3 知识图谱
  • 8.4.4 自动文摘
  • 8.4.5 情感分析
  • 8.4.6 谷歌BERT技术
  • 8.5 自然语言处理在医疗领域的应用
  • 8.5.1 生物医学文本挖掘
  • 8.5.2 临床决策支持系统
  • 8.5.3 自动问答系统
  • 参考文献
  • 第9章 医疗数据隐私保护
  • 9.1 医疗数据隐私保护概述
  • 9.1.1 医疗大数据的来源及潜在的隐私风险
  • 9.1.2 全流程的医疗大数据隐私保护
  • 9.2 匿名隐私保护
  • 9.3 差分隐私及其应用
  • 9.3.1 差分隐私的定义及相关概念
  • 9.3.2 差分隐私的实现机制
  • 9.4 其他隐私保护方法
  • 9.4.1 机密计算
  • 9.4.2 模型隐私
  • 参考文献
  • 第10章 医疗经济概况与前景
  • 10.1 医疗经济概况
  • 10.2 医疗经济的市场分析
  • 10.3 医疗大数据现状
  • 10.4 医疗经济的前景
展开全部