基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf  mobi txt 电子书 下载

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载 2025

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载 2025


简体网页||繁体网页
[德] 西蒙·蒙策尔特 等 著,吴今朝 译

下载链接在页面底部


下载链接1
下载链接2
下载链接3
    

想要找书就要到 静思书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

发表于2025-04-03


商品介绍



出版社: 机械工业出版社
ISBN:9787111527503
版次:1
商品编码:11892134
品牌:机工出版
包装:平装
丛书名: 数据科学与工程技术丛书
开本:16开
出版时间:2016-03-01
用纸:胶版纸
页数:366

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载 2025



类似图书 点击查看全场最低价

相关书籍





书籍描述

编辑推荐

  

本书重点阐释自动化数据抓取和分析技术,适用于初中级用户。作者以简洁的代码、详细的讲解以及真实的案例,分析了大数据在社会科学领域的运用。作者尽可能回避晦涩的术语和高深的理论,通过非常实用的组件探讨很多有趣的实际问题。这种深入浅出的讲解方式有利于我们快速上手,在循序渐进中学习,并能把学到的技术应用到实际研究项目中。
  
  本书特色:
  提供关于网络抓取和文本挖掘的实用指南,既适合R的初学者,也适合有经验的用户。
  讲解互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等)。
  探索查询网络文档和数据集的基本技术(XPath及正则表达式),以及从动态HTML采集信息的技术。
  提出数据抓取和管理的实用工作流,包括从选择正确的方法到优化代码以及维护抓取程序。
  以案例分析为特色,每种技术都辅以详细的案例解析。
  提供大量练习题,帮助读者深入学习与总结每项技术。

内容简介

  

本书由资深社会科学家撰写,从社会科学研究角度系统且深入阐释利用R语言进行自动化数据抓取和分析的工具、方法、原则和实践。作者深入剖析自动化数据抓取和分析各个层面的问题,从网络和数据技术到网络抓取和文本挖掘的实用工具箱,重点阐释利用R语言进行自动化数据抓取和分析,能为社会科学研究者与开发人员设计、开发、维护和优化自动化数据抓取和分析提供有效指导。
  本书共17章,第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识,内容涉及互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等),并讲解用于查询网络文档和数据集的基本技术(XPath和正则表达式)。第9~11章介绍网络抓取和文本挖掘的实用工具箱,其中第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工作流程、真实环境数据中的陷阱以及规避它们的方法等问题提供一些实用的见解。

目录

译者序
前 言
第1章概述
1.1案例研究:濒危世界遗产地
1.2有关网络数据质量的一些讨论
1.3传播、提取和保存网络数据的技术
1.3.1在网络上传播内容的技术
1.3.2从Web文档中提取信息的
技术
1.3.3 数据保存的技术
1.4本书的结构
第一部分网络和数据技术入门
第2章HTML
2.1浏览器显示及源代码
2.2语法规则
2.2.1标签、元素和属性
2.2.2树形结构
2.2.3注释
2.2.4保留字符和特殊字符
2.2.5文档类型定义
2.2.6 空格和换行
2.3标签和属性
2.3.1 锚标签


2.3.6 标题标签、



2.3.7 通过

      列举内容
      2.3.8组织型标签和

      2.3.9 标签及其同伴
      2.3.10 外部脚本标签










前言/序言





基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载 2025

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 下载 epub mobi pdf txt 电子书 2025

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 pdf 下载 mobi 下载 pub 下载 txt 电子书 下载 2025

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 mobi pdf epub txt 电子书 下载 2025

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载
想要找书就要到 静思书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

读者评价

评分

多读书,可以让你变聪明,变得有智慧去战胜对手。书让你变得更聪明,你就可以勇敢地面对困难。让你用自己的方法来解决这个问题。这样,你又向你自己的人生道路上迈出了一步。 多读书,也能使你的心情便得快乐。读书也是一种休闲,一种娱乐的方式。读书可以调节身体的血管流动,使你身心健康。所以在书的海洋里遨游也是一种无限快乐的事情。用读书来为自己放松心情也是一种十分明智的。 读书能陶冶人的情操,给人知识和智慧。所以,我们应该多读书,为我们以后的人生道路打下好的、扎实的基础!读书养性,读书可以陶冶自己的性情,使自己温文尔雅,具有书卷气;读书破万卷,下笔如有神,多读书可以提高写作能力,写文章就才思敏捷;旧书不厌百回读,熟读深思子自知,读书可以提高理解能力,只要熟读深思,你就可以知道其中的道理了;读书可以使自己的知识得到积累,君子学以聚之。总之,爱好读书是好事。让我们都来读书吧。 其实读书有很多好处,就等有心人去慢慢发现. 最大的好处是可以让你有属于自己的本领靠自己生存。 最后在好评一下京东客服服务态度好,送货相当快,包装仔细!这个也值得赞美下 希望京东这样保持下去

评分

好书 到货速度稍微慢了点

评分

好书,值得认真学习。

评分

非常好的东东,货真价实,物流及时,很满意的一次购物体验。

评分

挺好的书,R语言的长项不在网络方面,不过,这本书讲的就是这方面。

评分

这本书值得一读,作者很诚实,确实一本书不能解决你所有的问题,但是可以给你一些思路,顺着这个思路去不断扩展自己的知识,最后娴熟运用。阅读纸质书最大的好处就是系统性,书中很多只是都通过网络资源零散的学过,但始终不成体系,本书能给你一个很好的网络数据获取的系统框架。

评分

专业必备书籍,送货速度快

评分

非常喜欢简单明了的介绍以及实用的方法,非常不错,在书店看过了再买的,推荐。

评分

挺好的,印刷没问题,正版书,买给公司的。

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载 2025

类似图书 点击查看全场最低价

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 epub pdf mobi txt 电子书 下载 2025


分享链接









相关书籍


本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

友情链接

© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有