大数据、小数据、无数据:网络世界的数据学术

大数据、小数据、无数据:网络世界的数据学术 pdf epub mobi txt 电子书 下载 2025

[美] 克莉丝汀L·伯格曼(Christine L·Borgman) 著,孟小峰,张祎,赵尔平 译
图书标签:
  • 大数据
  • 小数据
  • 无数据
  • 网络世界
  • 数据科学
  • 数据分析
  • 数据伦理
  • 隐私保护
  • 数字经济
  • 信息社会
想要找书就要到 静思书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 机械工业出版社
ISBN:9787111575788
版次:1
商品编码:12152589
品牌:机工出版
包装:平装
丛书名: 大数据管理丛书
开本:16开
出版时间:2017-08-01
用纸:胶版纸
页数:258

具体描述

产品特色

内容简介

本书立足于大数据背景,深入探讨了学术界的数据现状,并详细阐释了数据与学术之间的复杂关系。书中首先通过确定调查研究的前提——六项“挑战”——来吸引读者对学术数据的兴趣,然后就自然科学、社会科学和人文学科三个领域中的数据实践进行案例分析,后阐述其研究成果对学术实践和研究政策的推动意义。作者提出,要实现长期的数据管理和挖掘,就要对知识基础设施进行大量投资,这对学术研究的未来至关重要。本书适合相关学者、研究人员、高校领导、出版商、图书馆和数据档案馆的工作人员以及投资决策者和政策制定者阅读。

作者简介

Christine L. Borgman 加州大学洛杉矶分校信息研究系杰出教授和系主任。她是AAAS(美国科学促进会)和ACM(美国计算机学会)Fellow

目录

丛书前言
译者序
前言
致谢
作者简介
推荐语
第一部分 数据与学术
第1章 挑战2
1.1 引言2
1.2 大数据与小数据3
1.2.1 大4
1.2.2 开放性5
1.2.3 长尾6
1.3 无数据8
1.3.1 数据不可获取8
1.3.2 数据不可发布9
1.3.3 数据不可用10
1.4 六项挑战11
1.5 结论12
第2章 何为数据13
2.1 引言13
2.2 定义与术语14
2.2.1 按例定义15
2.2.2 操作定义16
2.2.3 分类定义17
2.2.4 概念区分21
2.3 结论23
第3章 数据学术25
3.1 引言25
3.2 知识基础设施26
3.3 社会与技术28
3.3.1 社区与协作29
3.3.2 知识与表示30
3.3.3 理论、实践与政策31
3.4 开放学术32
3.4.1 开放获取研究成果32
3.4.2 开放获取数据34
3.4.3 开放技术37
3.5 交流融合38
3.5.1 数据隐喻38
3.5.2 数据单元40
3.5.3 记录文件42
3.6 结论43
第4章 数据多样性44
4.1 引言44
4.2 学科与数据45
4.3 数据大小问题46
4.3.1 项目目标47
4.3.2 数据采集48
4.3.3 数据分析49
4.4 数据产生问题50
4.4.1 距离问题51
4.4.2 外部影响因素57
4.5 结论64
第二部分 数据学术案例研究
第5章 自然科学领域的数据学术66
5.1 引言66
5.1.1 研究方法与数据实践66
5.1.2 自然科学案例67
5.2 天文学68
5.2.1 数据大小问题69
5.2.2 数据产生问题72
5.2.3 天文学研究实践82
5.3 传感器网络科学与技术85
5.3.1 数据大小问题86
5.3.2 数据产生问题87
5.3.3 嵌入式传感器网络研究实践93
5.4 结论98
第6章 社会科学领域的数据学术100
6.1 引言100
6.1.1 研究方法与数据实践101
6.1.2 社会科学案例102
6.2 互联网调查与社交媒体研究102
6.2.1 数据大小问题103
6.2.2 数据产生问题104
6.2.3 互联网调查与社交媒体研究实践110
6.3 社会技术研究115
6.3.1 数据大小问题115
6.3.2 数据产生问题116
6.3.3 CENS的社会技术研究实践120
6.4 结论126
第7章 人文学科领域的数据学术129
7.1 引言129
7.1.1 研究方法与数据实践130
7.1.2 人文学科案例131
7.2 古典艺术与考古学132
7.2.1 数据大小问题133
7.2.2 数据产生问题133
7.2.3 古典艺术与考古学研究实践144
7.3 佛教研究150
7.3.1 数据大小问题151
7.3.2 数据产生问题151
7.3.3 佛教研究实践156
7.4 结论161
第三部分 数据政策与实践
第8章 数据共享、发布与重用166
8.1 引言166
8.2 研究类数据的供求分析168
8.2.1 研究类数据的供给分析169
8.2.2 研究类数据的需求分析173
8.3 学术动机174
8.3.1 出版物与数据174
8.3.2 数据资产与数据债务177
8.3.3 数据发布178
8.3.4 获取重用数据181
8.4 知识基础设施183
8.4.1 知识库、数据集与档案馆183
8.4.2 个体数据实践185
8.4.3 人力基础设施186
8.4.4 棘手问题187
8.5 各学科领域的知识基础设施187
8.5.1 自然科学188
8.5.2 社会科学192
8.5.3 人文学科193
8.6 结论194
第9章 数据信誉、归属与发现197
9.1 引言197
9.2 原则与问题199
9.3 理论与实践200
9.3.1 内容与格式:如何引用201
9.3.2 引用行为理论:何时、为何引用何种对象203
9.3.3 明确与否:信誉授予对象与责任归属对象206
9.3.4 名称或编号:身份问题211
9.3.5 当理论遇到技术:引用行为218
9.3.6 风险与回报:引用价值219
9.4 结论221
第10章 保存何种数据及其原因223
10.1 引言223
10.2 挑战回顾225
10.2.1 数据权利、责任、角色和风险 225
10.2.2 数据共享227
10.2.3 出版物与数据229
10.2.4 数据获取232
10.2.5 利益相关者及其技能233
10.2.6 过去、现在和未来的知识基础设施235
10.3 结论237
术语表238
人名表251
机构、书籍和项目名称表258
参考文献

前言/序言

在“大数据”风靡的当代,学术研究中的“小数据”依旧不容小觑。随着绝对数据量的增加,学者们进行个体研究的能力却不断退化。因为他们从未距离研究对象如此遥远。新工具和新视角成为学术研究的必需品。但相对于“小数据”而言,“大数据”不一定是最好的选择。因为研究者距离数据来源(即数据采集、处理、提炼和转换方式及其对应的研究假设和目的)越远,就越难理解数据代表的实际意义。因此,学者们更倾向于使用少量数据进行更深入细致的研究。但当数据尚未被发现甚至不可能被发现时,学者们将面临“无数据”的窘境。
相对于一般商品而言,研究类数据(research data)的利用价值或多或少。数据管理计划、数据发布需求以及由资助机构、学术期刊和科研机构提出的积极政策都很难适应数据多样性和跨领域的新实践。除了按例定义之外,很少有政策尝试给出数据的定义。那些反映学术界利益相关者竞争机制和动机的政策更是少之又少。数据的含义因人而异,因时不同;数据可以像资产一样受控、积累、交易、组合投资、挖掘甚至可能被发布;同时,数据也可以像债务一样被管理、保护或者毁约。数据的敏感性和保密性可能很高,因此数据发布往往伴随着高风险。数据价值可能立即显现,也可能很久之后才引人注意。有些数据值得长期监护,但大部分数据都只具有短期价值。某些研究类数据的价值可能在几个小时或几个月之内,随着技术和领域前沿工作的进步而不复存在。
要理解数据在学术研究中的价值,首先必须明确数据绝非一般事物,其不是具有本质内涵的自然对象。恰恰相反,出于研究或学术目的,学者们往往需要证明现象发生的论据,即观察结果、客观对象以及其他实体,而数据正是这些论据的表现形式。而且这种具体表现形式会因学者、情景以及时间的不同而有所差异。学者们虽然在自然科学、社会科学以及人文学科领域内创造、使用、分析和解释数据,但都尚未就数据定义达成共识。把某种事物概念化为数据的过程本身就是一种学术行为。学术活动包括寻求论据、解释现象以及论证观点等,这些活动以数据为媒介,最终往往表现为期刊论文、专著、会议论文以及学术界认可的其他形式。考虑数据重用的研究极为少见。
伽利略使用笔记本记录观察到的现象,19世纪的天文学家把图像刻在玻璃板上,而今天的天文学家则使用数字设备捕获光子。普通相机拍摄的夜空图像之所以能与航空任务采集的图像基本相似,是因为天文学家已经在数据描述和映射的表示体系上达成一致。为集成几个世纪以来的观测数据,天文学家已经在标准、工具和档案方面做了大量工作。即便如此,该领域的知识基础设施还远未建成,更不用说完全自动化了。就数据获取的组织和协调而言,信息专业技术人员在天文学等领域发挥着重要作用。
出版物和数据之间的联系体现在多个方面,这正是研究类数据在学术交流范围内得以充分利用的原因。数据创造可能需要长期的深思熟虑,这一漫长过程积累了许多随时间可增值的资源。但数据创造也可能历时很短,甚至具有偶发性。在后两种情况下,研究者需要尽可能记录现象发生时的所有仪器数据。在天文学、社会学和人种学等领域,不论研究计划制定得有多好,数据采集都具有随机性,因为每个阶段的研究发现都会影响下一阶段的数据选择。因此,任何领域的学者都需要学会评估数据优劣、判定数据信度和效度以及适应实验室研究、实地调查和档案馆的条件。出版物是特定领域中假设读者具有专业知识的条件下,对研究成果进行报告的形式,其为读者理解研究成果的论点、方法及结论提供了必要信息。但因为假定读者熟悉该领域,所以其往往省略重复研究所需的细节。虽然人们对数据发布各执己见,但数据的重复性与再现性只在特定领域具有相关性。而且即使是在这些领域,真正实现重复与再现也很困难。而判断哪个学术研究成果更具有保存价值更是难上加难。
数据管理、发布和共享等相关政策模糊了数据在学术活动中的复杂作用,而且在很大程度上忽略了领域内与领域间政策实践中的差异性。“数据”的概念在自然科学、社会科学和人文学科之间甚至同一学科内都存在很大差异。数据管理在很多领域内可学不可教,这使得现有解决方案缺乏系统性。一般而言,研究人员重用自己的数据都有很大困难,更不用说使这些数据为具有不同需求的其他人所用。由于数据共享实施难度大、激励机制有限,而且在知识基础设施工程建设方面需要大量投资,所以其规范仅存在于部分领域。
本书面向包括研究类数据利益相关者在内的广大读者,具体包括学者、研究人员、高校领导、出版商、图书馆和数据档案馆的工作人员以及投资决策者和政策制定者等。第一部分使用四章篇幅界定“数据”与“学术”的概念,详细讨论了数据、学术、知识基础设施以及研究实践的多样性。第二部分包括三章,分别探究了自然科学、社会科学和人文学科领域的数据学术(data scholarship)。这三个案例分析结构平行,便于进行跨领域对比。第三部分涵盖三个章节,主要阐述数据策略和数据实践相关内容,并尝试分析数据学术面临众多棘手问题的原因。这部分具体包括:数据共享、发布与重用。
《解码网络:无处不在的数据洪流与智能涌现》 在信息爆炸的时代,我们与数据的关系早已超越了简单的“有”与“无”。无论是浩如烟海的网络痕迹,还是微不足道的瞬间捕捉,数据以其前所未有的密度和广度,织就了一张覆盖我们生活方方面面的隐形巨网。这本书,并非探究“大数据”、“小数据”或“无数据”本身的概念界定,而是聚焦于这张巨网如何被编织、如何被感知、如何被利用,以及它如何催生出我们前所未见的智能现象。 想象一下,互联网不再仅仅是信息传递的管道,它变成了一个巨大的、不断涌动的生命体,每一条链接、每一次点击、每一次互动,都是它神经元的一次搏动。我们人类的社会活动、情感表达、知识创造,都以前所未有的速度和规模,化为数字的血液,在网络的血管中奔流。这本书将带领我们深入这场波澜壮阔的数字洪流,去理解其内在的逻辑、演化的规律,以及由此孕育出的全新可能。 第一部分:数据之海的涌现与形态 我们将从数据产生的源头出发,审视其多样的形态和独特的涌现机制。 网络空间的原子: 从最基础的网络日志、通信记录,到用户行为的每一次点击、每一次滑动,这些最微小的数字痕迹,构成了网络数据最基本的“原子”。我们不讨论它们的大小,而是关注它们如何被记录、如何被聚合,以及如何在海量中展现出规律。 社交涟漪与情感图谱: 社交媒体平台上的每一次分享、每一次评论、每一次点赞,都不仅仅是简单的交互,它们是情感的释放、观点的碰撞、关系的维系。我们将揭示这些看似碎片化的信息,如何汇聚成庞大的情感图谱,反映出群体的情绪波动、社会思潮的演变,以及人际网络错综复杂的连接。 知识的迁移与演变: 从搜索引擎的每一次查询,到维基百科条目的每一次编辑,知识在网络空间中以前所未有的速度流动、碰撞、重组。我们将探讨这种知识的动态化过程,以及它如何驱动着信息的迭代更新和智能的生成。 物联世界的脉搏: 传感器、智能设备、物联网的触角,正深入到我们生活的每一个角落。从智能家居的温度调节,到城市交通的实时监测,再到工业生产的精细控制,大量的实时数据构成了物理世界的数字孪生。我们将分析这些来自真实世界的“脉搏”数据,如何与网络空间的数据相互交织,形成更全面的感知。 第二部分:解码网络的内在逻辑与规律 数据并非杂乱无章,网络空间中潜藏着深刻的内在逻辑和运行规律。 链接的智慧: 网络的核心在于链接。我们将深入分析超链接、社交连接、数据之间的关联,如何构建起复杂的信息网络。从 PageRank 算法的经典理念,到更复杂的网络拓扑分析,我们理解链接结构如何决定信息的传播范围、影响力的扩散,以及隐藏的社群结构。 涌现的模式与混沌: 在看似随机的海量数据中,我们总能发现令人惊叹的模式。从用户的集体行为,到市场趋势的预测,再到病毒式传播的机制,我们将探讨如何从混乱的数据中“涌现”出有意义的模式,以及这些模式背后隐藏的社会、心理和经济规律。 时间序列的叙事: 许多网络数据都带有时间属性,用户的行为轨迹、信息的更新频率、事件的发生顺序,共同构建了一个动态的时间序列。我们将学习如何解读这些时间序列,从中挖掘出事件的因果关系、趋势的变化,以及未来的预测。 隐形的信号与噪音: 在海量数据中,真实的信号往往被淹没在噪音之中。我们将探讨如何从纷繁的干扰中提取出有价值的信息,如何辨别虚假信息,以及如何过滤掉无关紧要的噪声,聚焦于核心的洞察。 第三部分:智能的诞生与边界的拓展 正是对这些数据洪流的理解和分析,催生了当今时代最令人瞩目的智能涌现。 从数据到洞察: 我们将聚焦于如何将原始数据转化为有价值的洞察。这包括对数据进行清洗、转换、可视化,以及利用统计学、机器学习等方法,从中发现趋势、预测未来、识别异常。 机器的学习与进化: 机器学习算法是如何从数据中学习的?我们将解析神经网络、深度学习等核心技术,理解它们如何模仿人类的认知过程,从而实现图像识别、自然语言处理、推荐系统等一系列智能应用。 智能体的行为与交互: 随着人工智能的发展,我们身边的智能体越来越多。从智能客服到自动驾驶,再到个性化推荐引擎,我们将探讨这些智能体如何基于对数据的理解,做出决策、与人类互动,以及它们在不同场景下的应用。 网络的“智慧”与集体智能: 网络本身也展现出一种“集体智慧”。我们将探讨 Crowdsourcing、分布式计算等模式,如何汇聚个体的力量,解决复杂的问题。同时,我们也将审视群体智能的形成机制,以及它如何超越个体智能的总和。 伦理与未来的挑战: 随着数据规模的爆炸式增长和智能应用的普及,我们面临着前所未有的伦理挑战。数据隐私、算法偏见、信息茧房、人工智能的潜在风险,都将是我们不可回避的议题。这本书将引导我们思考,如何在拥抱数据驱动的智能时代的同时,确保其发展方向符合人类的根本利益。 《解码网络:无处不在的数据洪流与智能涌现》 并非一本枯燥的技术手册,它是一次深入网络世界内在机制的探索之旅。它将带领你穿越数据之海,感受智能涌现的脉搏,理解我们所处的数字时代正在发生的深刻变革。无论你是对网络技术充满好奇的学生,还是希望在数字化浪潮中把握机遇的商业人士,亦或是关注科技发展对社会影响的普通读者,本书都将为你提供一个全新的视角,去理解这个由数据编织而成,并不断涌现出智能的奇妙世界。它将帮助你不再只是数据的被动接收者,而是能够理解数据、驾驭数据,并最终拥抱智能时代的有力参与者。

用户评价

评分

这本书就像是一扇窗,让我得以窥见网络世界背后那庞大而复杂的数据景观。作者以一种极其精妙的笔触,勾勒出了“大数据”、“小数据”与“无数据”之间错综复杂的关系,并将其升华为一种全新的“数据学术”理念。读这本书的过程中,我仿佛置身于一个巨大的信息海洋,时而遨游于“大数据”的浩瀚星辰,感叹其统计学上的震撼力量;时而又潜入“小数据”的涓涓细流,发现其蕴含的精微洞察。而最令我着迷的是“无数据”的章节,它并没有回避信息的不足,反而通过对“空白”的解读,揭示了更多关于事物本质的线索。作者巧妙地运用了跨学科的视角,将社会学、心理学、传播学等领域的理论融会贯通,使得本书既有学术的深度,又不失文学的趣味。它让我明白,数据不仅仅是冷冰冰的数字,更是连接现实世界与虚拟世界的重要桥梁,是理解人类行为和社会现象的有力工具。这本书让我重新思考了我们与信息的关系,以及如何在海量数据中保持清醒的头脑和批判性的思维。

评分

这本书给我带来了许多意想不到的惊喜。我原本以为它会是一本关于大数据分析技术或者某种特定算法的指南,但它显然走得更远。作者巧妙地将宏观的“大数据”理论与微观的“小数据”实践相结合,甚至触及了“无数据”这种看似悖论的概念,构建了一个非常完整和具有启发性的数据生态图景。我特别喜欢书中对于“大数据”的批判性视角,它并没有一味地歌颂大数据的力量,而是提醒我们警惕其潜在的风险,比如隐私泄露、算法偏见等。同时,作者对“小数据”的推崇也让我眼前一亮。很多时候,精准而有针对性的“小数据”分析,反而比泛泛而谈的“大数据”更能解决实际问题,也更容易被普通人理解和应用。而“无数据”的章节更是充满了哲学意味,它引导我们去思考信息的不完整性,以及如何在信息稀缺的情况下做出判断和决策。这本书的语言风格也非常流畅,行文间充满了智慧的火花,没有晦涩难懂的专业术语,即使是对数据领域不太熟悉的读者,也能轻松阅读并获得深刻的感悟。

评分

这本书真的是颠覆了我对“数据”这个概念的理解。我一直以为数据就是那些冰冷、庞大的数字集合,只有那些拥有强大计算能力的科技公司和研究机构才能玩转。但这本书让我明白,即使是看似微不足道的“小数据”,甚至有时候“无数据”的状态,也蕴含着深刻的洞察力。作者通过大量生动有趣的案例,比如从社交媒体上的只言片语中捕捉社会情绪,或是从日常生活中的点滴观察中发现规律,都展现了如何从不同维度去解读和利用信息。尤其是关于“无数据”的部分,我之前从未想过,信息的缺失本身也可以成为一种有价值的信号,它迫使我们去思考因果关系,去质疑表象,去探寻更深层次的机制。读这本书的时候,我常常会停下来,反思自己过去是如何看待数据,如何利用信息的。它让我意识到,我们每个人,无论是在工作还是生活中,都可以成为一个“数据侦探”,用敏锐的观察和审慎的思考,从看似零散的信息中构建出有意义的认知。这本书并非枯燥的技术手册,而更像是一次思想的启蒙,它鼓励我们打破思维定势,以一种更开放、更具创造性的方式去拥抱信息时代。

评分

我一直对那些能够连接不同学科、跨越技术边界的书籍非常感兴趣,而《大数据、小数据、无数据:网络世界的数据学术》恰恰是这样一本难得的佳作。它没有将自己局限于某个特定的学科领域,而是从更广阔的视角审视了数据在当代社会中的角色和意义。作者在书中提出的“数据学术”概念,让我耳目一新。这不仅仅是指利用数据进行学术研究,更是一种全新的思维模式和认知方式。通过对“大数据”的宏观分析,“小数据”的微观洞察,以及“无数据”的逻辑推演,本书构建了一个丰富的数据解读体系。我印象深刻的是,书中通过一些社会学、心理学甚至人类学的案例,来解释数据是如何影响和塑造我们的社会行为和个体认知的。这使得这本书不仅仅是一本关于数据的方法论,更是一本关于人与信息关系的哲学思考。它鼓励读者不仅仅是数据的收集者和分析者,更是数据的理解者和批判者,去审视数据背后的逻辑,去探寻信息传递的本质。

评分

坦白说,一开始我拿到这本书时,并没有抱太大的期望,以为又是市面上那种充斥着专业术语和复杂模型的“硬核”读物。但读完之后,我必须承认,我被深深地打动了。作者用一种非常亲切、易懂的方式,将“大数据”、“小数据”、“无数据”这三个看似独立的概念串联起来,并赋予了它们全新的生命力。我特别欣赏书中对于“小数据”的解读,它让我意识到,我们身边充斥着大量的“小数据”,而这些往往被我们忽略的信息,却是理解事物真相的关键。比如,作者通过对一些网络评论、用户行为的细致分析,揭示了隐藏在海量信息背后的个体需求和情感表达。而“无数据”的部分更是点睛之笔,它挑战了我过去对“信息越多越好”的固有认知,让我开始反思,有时候,信息的缺失本身也传递着重要的信息,它迫使我们去更深入地探究事物的本质。这本书没有给我带来任何技术上的指导,但它却极大地拓展了我的思维边界,让我对“数据”这个词有了更丰富、更立体的理解。

评分

不错,实惠,快递又快

评分

如果有电子版读电子版更实惠一点

评分

专业书,还没看,应该不错,物流快

评分

书包装精美,纸张质量不错,正品!支持!

评分

全是理论性的阐述,不知道是不是东抄抄西抄抄,机械工业出版社的书又薄又贵,内容还未知。有点垃圾

评分

很不错很有意义

评分

好书

评分

需要一定的机器学习基础

评分

默认评价,好书!

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有