作者简介

Ryan Mitchell

内容简介

本书采用简洁强大的爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。

下载地址

豆瓣评论

  • 源泉Studio
    “Bug 是产品生命中的挑战,好产品是不断面对 Bug 并战胜 Bug 的结果”,标题是网络数据采集,主体内容不仅有网络爬虫相关的内容,还有与之相关的如数据库、自然语言分析、云平台等等,但是对于一本两百多页的“小书”来说,这样的内容安排显得过多过杂了,网络爬虫涉及到的知识体系确实庞杂,但是什么都说,结果就是什么都说不清楚,使得这本书不像一本合格的教程,更像另外一本1000页以上大部头教程的绪论部分。另外作为国外出版的爬虫类书籍,最为致命的就是“科学上网”的问题,案例中的涉及的Wiki、Twitter、Google等等网站在国内通通被墙,不知道是该笑,还是该笑呢2022-03-19
  • Showing V1.4.1
    提纲挈领的入门书,惊讶地发现好多东西我居然已经都自己摸索出来了……2018-08-07
  • 这么近,那么远
    可以。“本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。”2018-12-18

猜你喜欢

大家都喜欢