作品简介
对大数据的搜索与挖掘,在当今的“互联网+”时代是很有必要的。本书提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际权威的数据库产品评测机构DB-Engines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名第一的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。
高凯,汉族、教授,博士毕业于上海交通大学计算机应用技术专业,省级重点学科“计算机软件与理论”中“信息检索与云计算”方向学术带头人,硕士研究生导师;中国计算机学会会员,fnternational Journa/ of Computer App/ications inTechnology副主编(2013—2017),5th、6th、7th International Conference on Modelling,Identification and Control程序委员会委员;主要研究方向为大数据搜索与挖掘、自然语言处理、网络信息检索、社会计算等;近几年出版了《大数据搜索与挖掘》、《信息检索与智能处理》、《网络信息检索技术及搜索引擎系统开发》等学术专著及多部规划教材,在国内外学术期刊Expert Systems With Applications、InternationalJournal on Intelligent Information and DatabaseSystem、International Journal on Modelling,ldentification and Control、《中文信息学报》、《电子学报》、《小型微型计算机系统》等以及PAKDD等国际学术会议上发表学术论文几十篇;主持及参与国家、省级科研课题多项;申请软件著作权登记十余项;目前在研课题有国家自然科学基金课题、省自然科学基金课题等。
