网络上的数据量越来越大,单靠浏览网页获取信息越来越困难,如何有效地提取并利用信息已成为一个巨大的挑战。本书采用简洁强大的Python语言,全面介绍网络数据采集技术,教你从不同形式的网络资源中自由地获取数据。你将学会如何使用Python脚本和网络API一次性采集并处理成千上万个网页上的数据。本书适合熟悉Python的程序员、安全专业人士、网络管理员阅读。书中不仅介绍了网络数据采集的基本原理,还深入探讨了更不错的主题,比如分析原始数据、用网络爬虫测试网站等。此外,书中还提供了详细的代码示例,以等
●译者序 ix内容简介
本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。靠前部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。 (美)米切尔(Ryan Mitchell) 著;陶俊杰,陈小莉 译 Ryan Mitchell,数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。哈哈哈
评分还不错,但是翻译在纸质上的,已经落后了。
评分内容值得学习。内容值得学习。内容值得学习。
评分很好的书 没有折角 还有过塑
评分书是好书,还望多看。
评分书很新很不错
评分书收到了,印刷挺清楚,物流一如既往的快,满意
评分这本书算是比较系统的讲解网络爬虫的基础教程,所用的系统版本是Python3。不足之处在于作者写代码稍显随意,明明用下划线连接的变量名更有利于阅读,偏偏作者就是很任性的用驼峰式的变量名。并且有一个贯穿全文的问题,调用bs4时一直没有指定解析器。但不管怎么说,本书终究还是目前所能找到的最好的Python3爬虫入门书了
评分还不错,但是翻译在纸质上的,已经落后了。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有