作品简介

Selenium是ThoughtWorks公司开发的一款用于Web应用程序测试的工具,它凭借支持多种浏览器、支持各种语言、跨平台、开源等优点得到了广泛应用。本书以Python 3.x为基础,借助多个案例项目介绍Selenium的用法,涵盖内容采集、数据处理、单元测试等内容。本书共分为17章,主要内容有安装Selenium、页面导航、元素定位、PhantomJS、数据编解码、单元测试、多线程、发送邮件、Selenium IDE、Python扩展、图形化测试等。本书每章都包含相应的实践内容,而且在适当的位置还包含综合性的实战环节,帮助读者检验前面所学内容并活学活用。本书内容通俗易懂,案例丰富,实用性强,适合从事Python开发、大数据开发、爬虫开发、前端开发以及测试等工作的人员阅读。

刘傲凡,精通互联网技术和计算机爬虫技术,熟悉网页抓取原理及技术,并在HTML、JavaScript、正则表达式、Jsoup、jQuery等方面有深入研究,还对WebMagic框架、PhantomJS、Headless Chrome、Selenium WebDriver等前沿技术保持着极高的热情和浓厚的兴趣。作者曾于《中山大学研究生学刊》发表论文“基于大数据的问答网站用户质量与数量的关系浅析—— 以知乎为例”。同时,作者深刻理解验证码识别、数据挖掘、数据存储等技术,曾协助多家企业搭建分布式爬虫架构。

作品目录

  • 内容提要
  • 作者简介
  • 前        言
  • 资源与支持
  • 第1章 安装Selenium
  • 第2章 页面导航
  • 第3章 元素定位
  • 第4章 利器——PhantomJS
  • 第5章 基于Python官网的实战
  • 第6章 基于今日头条的实战
  • 第7章 数据的编解码和处理
  • 第8章 基于猫眼电影的实战
  • 第9章 基于淘宝商品的实战
  • 第10章 单元测试
  • 第11章 多线程
  • 第12章 发送邮件
  • 第13章 Selenium IDE
  • 第14章 Python扩展
  • 第15章 GUI测试
  • 第16章 基于知乎的实战
  • 第17章 基于新浪微博的实战
  • 附录A 如何阅读源代码
  • 附录B Git分布式计算
展开全部