元数据:用数据的数据管理你的世界 中信出版社

元数据:用数据的数据管理你的世界 中信出版社 pdf epub mobi txt 电子书 下载 2025

[美] 杰弗里·波梅兰茨 著,李梁 译
图书标签:
  • 元数据
  • 数据管理
  • 数据科学
  • 信息架构
  • 数据治理
  • 中信出版社
  • 数字化转型
  • 数据战略
  • 知识管理
  • 数据分析
想要找书就要到 静思书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 中信出版社官方旗舰店
出版社: 中信出版集团
ISBN:9787508670782
商品编码:11295642503
品牌:中信出版(Citic Press)
开本:32开
出版时间:2017-02-01
用纸:纯质纸
页数:216
正文语种:中文

具体描述

  ★著名大数据专家,《大数据》、《数据之巅》作者涂子沛力荐;推动建立企业元数据管理平台,深入了解无所不在的元数据,世界的本质是数据——数据管理时代来了!认识数据已经成为互联网公民zui基本的一课。
  ★本书作者杰弗里·波梅兰茨曾在慕课讲授课程“元数据:组织和探索信息“,深受学生们的喜爱。在出版这本书之后,他还结合了在元数据领域从事前沿工作的专家的zui新观点。是科普元数据的第yi本书。

  元数据是关于数据的数据,我们身边的一切信息和资源都可以用元数据来描述。元数据会从资源中抽取用来说明其特征和内容的结构化数据,用于组织、管理、保存、检索信息和资源。虽然我们看不见元数据的存在,但它却无时无刻不伴随我们左右,搜集我们的信息,管理我们的世界。我们平时所津津乐道的大数据,也是基于元数据来计算的。
  这本书梳理了元数据的发展历史、元数据的类型与应用,是科普元数据的一本书。它使我们看到,互联网发展得越来越快,元数据的格式也越来越多,人们对它的操作要求也越来越高。“斯诺登事件”之后,更多人开始关心元数据的使用方法与保护措施,因为它直接关系着个人、企业和组织的隐私。
  这本书也结合了元数据领域的前沿趋势,告诉我们利用元数据可以为大数据平台绘制数据地图,对数据平台进行监控……可做的事情如此之多。如今元数据具有前所未有的地位,企业和组织也非常重视元数据的开发与管理,事实上元数据已经催生出了完整的子技术产业,包括元数据管理、数据架构等。对每一位互联网公民来说,认识元数据是加深对互联网的认识、辨别互联网上众多信息的必经之路。


  (美)杰弗里·波梅兰茨(Jeffrey Pomerantz),拥有20多年研究经验的信息科学家,美国北卡罗来纳大学教堂山分校情报学专业和图书馆学专业的终身教授,华盛顿大学的客座教授。他在MOOC上的课程“元数据:组织和探索信息”深得众多学生的喜欢,以及业内专家的肯定。

第一章 元数据概览
隐形的元数据 / 006
元数据简史 / 007
元数据,不再仅仅用于图书馆 / 014
形形色色的元数据 / 015
第二章 定义元数据
数据中的信息 / 021
描述主题 / 024
元数据是对信息的陈述 / 027
编码体系 / 031
规范文档 / 036
叙词表 / 038
网络分析 / 043
本体论 / 046
失控的元数据 / 048
元数据记录 / 053
内部元数据与外部元数据 / 055
唯yi识别符 / 060
第三章 描述性元数据
都柏林核心元数据元素集 / 067
采纳创新的成本 / 069
15 个元素 / 072
元素与值 / 074
描述性记录 / 078
都柏林核心修饰词 / 080
网页中的元数据 / 084
都柏林核心元数据元素集的意义 / 088
第四章 管理性元数据
技术性元数据 / 095
结构性元数据 / 098
溯源元数据 / 099
保存性元数据 / 103
权限元数据 / 105
元– 元数据 / 108
管理性元数据的功能 / 112
数据废气 / 121
并行数据 / 122
第五章 使用性元数据
数据废气 / 121
并行数据 / 122
第六章 实现元数据的技术
结构化数据 / 129
描述资源的框架 / 134
都柏林核心元数据的抽象模型 / 136
可扩展标记语言 / 139
文档类型定义 / 141
第七章 语义网
什么是语义网 / 148
软件代理 / 149
什么是关联数据 / 151
一切都是相连的 / 154
艺术关联数据 / 156
来源于维基百科内容的数据集 / 160
关联开放数据 / 166
多即是多 / 168
微数据 / 170
语义网的愿景 / 175
第八章 元数据的未来
特定领域中的元数据 / 181
应用编程接口 / 184
以数据为基础的分析 / 187
元数据的策略 / 190
致 谢 / 197
图表来源 / 201
延伸阅读 / 203

  弄懂元数据,越来越被公认为是理解下一代互联网——语义网的基础,甚至是打开整个信息科学体系、复杂数据世界的钥匙。本书用通俗易懂的语言讲清楚了这个基础的问题,十分难得。
  ——涂子沛 著名大数据专家 《大数据》、《数据之巅》作者
  元数据是解释数据库的数据的科学与艺术!如何从大数据中发现知识,寻找隐藏在数据中的趋势、模式和相关性,都需要我们拥有更好的数据洞察力,而这种洞察的基础来自我们对元数据的理解。
  ——沈浩 中国传媒大学新闻学院教授、博导
  元数据绝对会告诉你关于别人生活的一切。如果你有足够的元数据,你就不需要数据内容。
  ——斯图尔特·贝克尔 美国国家安全局前总法律顾问



  元数据(metadata)在我们的周围无时不在,无处不在。当代社会中随处可见的电子设备,不是依靠元数据来运行,就是用于产生元数据,或者两者皆有。但当元数据真正发挥作用的时候,它却隐于幕后、默默无闻,就像根本不存在一样。一定程度上来说,这也让元数据在2013 年夏天突然成了一个广受关注且具有争议性的话题。
  2013 年5 月,美国国家安全局前外聘员工爱德华·斯诺登(Edward Snowden)飞往中国香港与英国《卫报》记者会面,向其披露了大量有关美国国家安全局在本土进行监听活动的机密文件。这些监听项目之一——“棱镜”(PRISM),涉及直接向电信公司搜集电话呼叫的数据。不用说,《卫报》对此事的报道成为轰动一时的大新闻。
  美国媒体对斯诺登泄密事件反应不一,随着事态的发展,这些反应的变化耐人寻味。对于美国国家安全局暗中搜集美国公民数据的行为,公众当时zui直接的反应就是群情激愤。然而随着事件日趋明朗,让人们如释重负的是,美国国家安全局搜集的仅仅是与电话呼叫有关的元数据,而不是电话呼叫本身的内容。换句话说,美国国家安全局没有进行窃听活动。这很快缓和了公众的怒火。事态随后急转直下,媒体通过调查才发现,凭借区区元数据居然能推断出如此多的个人信息。在此之后,对这一事件的权wei解读才终于公之于众。
  MetaPhone项目是斯坦福大学法学院互联网与社会研究中心(Stanford Law School Center for Internet and Society)的研究人员于2013 年年底进行的一项研究,旨在重现美国国家安全局搜集电话呼叫元数据采取的方法。他们发现,用区区元数据居然能推断出如此令人难以置信的信息量。MetaPhone的研究人员在报告中提到了这样一个案例:一位研究对象分别打电话联系了“家庭装修用品店、锁匠、水培植物经销商还有烟草大麻用具店”。也许,打这些电话是出于非常单纯、合理的原因,也许它们之间完全没有关系……但是这可能并不是我们大多数人会得出的结论。
  许多元数据都与电话呼叫有关,尤其是手机呼叫。而在与电话呼叫有关的元数据片段中,zui显而易见的就是拨打与接听双方的电话号码,其次就是电话呼叫的时间与通话时长。如果使用具备GPS(全球定位系统)功能的智能手机拨打电话,还可搜集到拨打与接听双方的地理位置信息,至少可以精确到通话双方手机所在地区手机信号塔的信号范围。与手机呼叫关联的元数据还有很多,但是如此少量的信息也足以让倡导保护隐私的人士再三思忖。因为即使你没有在打电话,你的手机也会与本地手机信号塔之间交换数据。这样一来,移动运营商就能随时搜集你的位置信息以及一段时间内的活动轨迹—根据斯诺登披露的机密文件显示,移动运营商实际也在这样做。当然,前提是你一直带着自己的手机。
  元数据这个词就这样成了一个公众话题。鉴于元数据如此广泛地存在,人们理应更好地去了解它,而公众也早应该进行这样的讨论。在当代世界中,计算活动无处不在,因此元数据像电网和高速公路网一样成了一种基础设施。这些当代基础设施的构成部分一方面发挥着不可或缺的作用,另一方面它们展现在我们面前的又只是冰山一角。比如,当你触动照明开关时,你就变成了大量技术与策略的zui终用户。
  分开来看,这些技术或策略也许微不足道、无关紧要,但是聚合在一起,就能带来深远的文化与经济影响。元数据亦是如此。就像电网和高速公路网一样,元数据不知不觉地融入日常生活的背景之中,理所当然地成为当代社会得以稳步前进的动力之一。
  作为生活在现代世界的公民,我们熟悉电网、高速公路网以及其他现代的基础设施,也对其有着合理(尽管可能并不完整)的了解。但是除非你是一位信息技术科学家,或者是为美国国家安全局工作的情报分析师,否则可能无法对元数据形成这样的认识。
  这就是我写作本书的目的—向你介绍元数据,以及元数据涉及的诸多主题与问题。我将探讨什么是元数据及其存在的原因、适用于不同用户与用例的各类元数据以及使现代元数据
  成为可能的一些技术,还会预测元数据的未来路在何方。读完本书,你无论身在何处都会看到元数据。
  这是一个元数据的世界,而你就身处其中。









好的,这是一份关于其他图书的详细简介,重点放在了元数据管理、数据治理和信息组织等相关领域,力求内容充实且自然流畅。 --- 《信息架构实战指南:构建高效数字内容生态》 图书简介 在这个信息爆炸的时代,数据和内容以前所未有的速度和规模涌现。然而,信息过载带来的挑战并非源于内容的稀缺,而是源于查找、理解和有效利用信息的困难。本书《信息架构实战指南》正是为应对这一挑战而生,它系统阐述了信息架构(Information Architecture, IA)的核心原则、方法论和实践工具,旨在帮助组织和个人构建一个清晰、直观、可扩展的数字内容生态系统。 本书深度探讨了信息架构如何作为一座桥梁,连接用户的需求与组织的数字资产。我们从信息架构的基本概念入手,清晰界明了它与用户体验设计(UX)、内容策略(Content Strategy)以及数据管理之间的相互关系和协同作用。信息架构不仅仅是设计网站的导航菜单或分类标签,它更是一种深层次的思维模型,关乎如何组织、结构化和呈现信息,以确保用户能够高效地“找到、理解和使用”所需内容。 第一部分:信息架构的基础与核心理念 本部分将带读者进入信息架构的理论基石。我们首先解析信息架构的四大支柱:组织系统(Organization Systems)、标签系统(Labeling Systems)、导航系统(Navigation Systems)和搜索系统(Searching Systems)。理解这些系统如何协同工作,是设计任何有效信息环境的前提。 组织系统:分类与层级。我们将详细分析不同的分类方法,例如层级分类法、序列分类法、矩阵分类法和本体论方法。重点讨论如何根据用户心智模型(Mental Models)和内容结构来选择最合适的组织框架。书中提供了大量的案例分析,展示了如何通过精心设计的分类体系,将复杂的信息集梳理得井井有条。 标签系统:命名的艺术与科学。标签是用户与信息互动的第一个接触点。本书深入探讨了如何创建清晰、一致且无歧义的标签。这包括了对术语学(Terminology)的研究、避免行话(Jargon)的技巧,以及利用用户研究(User Research)来确定最能引起目标受众共鸣的词汇。 导航系统:引导用户前行。导航不仅是地图,更是用户的承诺。我们探讨了全局导航、局部导航、上下文导航等不同层级的导航设计。如何平衡信息的深度与广度,确保用户始终清楚“我在哪里”和“我能去哪里”,是本部分讨论的重点。 搜索系统:应对主动查询。在用户明确知道自己需求时,搜索功能是关键。本书探讨了搜索体验的设计,包括搜索结果的排序算法、筛选器(Facets)的构建逻辑,以及如何处理“零结果”情况,确保搜索不再是信息获取的死胡同。 第二部分:信息架构的实践方法论 理论必须落地为实践。本部分专注于信息架构师在项目周期中需要掌握的实用工具和流程。 内容审计与信息发现(Content Auditing and Discovery)。任何良好的架构都始于对现有资源的全面盘点。本书提供了详尽的内容审计流程,包括收集、评估和映射现有内容的步骤。通过识别内容的差距、冗余和冲突,我们为后续的重构奠定坚实的数据基础。 用户研究在IA中的应用。信息架构的核心是为人服务。本章强调了用户研究方法在IA设计中的关键作用。我们详细介绍了卡片分类法(Card Sorting)、树形测试(Tree Testing)、用户访谈和日记研究如何为组织结构和标签命名提供实证支持,避免主观臆断。 蓝图绘制与文档化。信息架构师需要清晰地传达其设计意图。本书提供了构建站点地图(Sitemaps)、内容模型(Content Models)和线框图(Wireframes)的最佳实践。特别关注如何使用UML图表或流程图等工具,将复杂的结构关系可视化,从而促进跨职能团队(设计、开发、内容团队)的有效沟通。 响应式IA与跨平台一致性。在多设备、多渠道的时代,信息架构必须具有响应性。我们讨论了如何设计一个能够适应不同屏幕尺寸和交互模式的统一信息结构,确保用户体验的连续性。 第三部分:高级主题与未来趋势 随着技术的进步,信息架构也在不断演化。本部分展望了IA与新兴技术和复杂系统的结合。 本体论(Ontology)与语义网:探讨如何通过更严格的结构化定义(本体论)来描述内容之间的复杂关系,为人工智能和机器理解信息打下基础。这部分内容对构建企业知识图谱或复杂数据库架构具有重要指导意义。 数据结构化与内容管理系统(CMS)的整合:分析了信息架构设计如何直接指导内容模型的构建,从而优化CMS的配置。清晰的架构能极大提升内容的重用性、可维护性和发布效率。 绩效衡量与持续优化:信息架构不是一次性项目,而是持续优化的过程。本书介绍了如何利用分析工具(如热图、用户流失率、搜索日志)来评估现有架构的有效性,并建立反馈循环,驱动迭代改进。 《信息架构实战指南》不仅是为网页设计师和内容策略师准备的工具书,更是为所有致力于管理和优化信息流的专业人士——包括产品经理、知识管理者和数据架构师——提供的一套严谨、实用的思维框架。通过掌握这些原则,读者将能够将混乱的数字信息转化为清晰、可导航、富有洞察力的资产,最终提升用户的满意度和组织的运营效率。 ---

用户评价

评分

这本书为我打开了一个全新的视野,让我开始重新审视“信息”在我们生活中的角色和价值。我过去习惯于被动地接收和存储信息,而《元数据》则引导我主动去理解和管理这些信息。作者将“元数据”定义为“关于数据的数据”,这个简洁而深刻的定义,让我瞬间明白了它在整个信息生态系统中的核心地位。书中对于不同行业和场景下元数据应用的案例分析,让我看到了它广泛的适用性和巨大的潜力。无论是科学研究、商业决策,还是个人生活,元数据都扮演着不可或缺的角色。我特别欣赏作者在书中对于“元数据标准化”的探讨,它强调了在统一的标准下进行元数据管理,能够极大地提升数据的互操作性和共享性。这对于构建一个更高效、更互联的信息社会至关重要。这本书的阅读体验是渐进式的,从基础概念到高级应用,层层递进,让我能够逐步建立起对元数据管理的全面认知。它 not only 满足了我对知识的好奇,更给了我实践的勇气和方向。我开始积极地将书中的理念和方法应用到我的工作中,并期待看到数据管理带来的积极变化。

评分

这本书的装帧设计非常精美,封面采用了一种沉静而富有质感的深蓝色,搭配烫金的书名“元数据”,散发出一种科技与智慧交织的迷人光彩。翻开书页,纸张的触感细腻而柔和,即使是长时间阅读也不会感到疲惫。从第一页开始,我就被作者流畅而富有洞察力的文字深深吸引。它不仅仅是一本关于数据管理的技术手册,更像是一次关于如何更好地理解和驾驭我们所处信息世界的深度探索。我尤其欣赏作者在处理复杂概念时的巧妙比喻和生动案例,让那些原本可能枯燥的技术术语变得鲜活易懂。例如,作者将元数据比作“数据世界的地图”,精准地描绘了它如何帮助我们导航海量信息,发现隐藏的联系。这种比喻的力量,让我瞬间理解了元数据的核心价值。书中对于不同类型数据的结构、关联以及如何通过元数据进行有效组织和检索的讲解,都让我受益匪浅。我曾几何时对那些庞杂的数字和文本感到无从下手,但这本书提供了一种全新的视角,让我看到了数据背后蕴含的秩序和规律。它让我意识到,真正强大的信息管理,并非在于拥有多少数据,而在于如何理解和利用这些数据。

评分

我一直认为,数据分析的深度和准确性,很大程度上取决于数据的质量和易用性,而《元数据》这本书则为我们揭示了实现这一目标的关键所在。作者对于“数据治理”的深刻见解,让我明白了元数据不仅仅是技术的堆砌,更是一种管理哲学的体现。它强调了从源头上保证数据的清晰、准确和一致性,而元数据就是实现这一切的基石。书中对于如何定义、采集、存储和利用元数据的详细阐述,为我构建一个更 robust 的数据管理体系提供了清晰的路线图。我尤其对书中关于“数据质量与元数据”之间关系的论述印象深刻,它清晰地表明,缺乏完善的元数据,数据质量的提升将无从谈起。作者通过生动的案例,展示了元数据在数据清洗、数据集成和数据迁移过程中的关键作用,让我深刻体会到“工欲善其事,必先利其器”的道理。对于数据从业者来说,这本书无疑是一本不可多得的宝典。它不仅仅提供了理论框架,更提供了大量的实践建议和解决方案,帮助我们克服数据管理中的实际挑战。我开始反思我过去在数据分析项目中的一些瓶颈,并意识到,很多问题的根源都在于对元数据重视不足。

评分

这本书让我对“个人信息管理”这个概念产生了全新的理解。我一直觉得,在信息爆炸的时代,管理个人数字资产是一件非常头疼的事情,文件堆积如山,查找起来耗时费力。但《元数据》的出现,如同点亮了一盏明灯。作者用清晰的逻辑和丰富的案例,阐释了如何通过“数据的元数据”来驯服这些杂乱无章的信息。我尤其喜欢书中关于“主动元数据管理”的理念,它强调了在我们创建或接收信息的过程中,就应该主动为其赋予有意义的描述性信息,而不是等到事情变得混乱不堪后再去补救。这就像是在建造一座信息的大厦时,每一块砖瓦都贴上了清晰的标签,让我们在需要时能够迅速找到目标。书中介绍的许多技巧,比如为文件命名建立统一的规范,利用标签系统来分类信息,甚至是如何利用现有软件的元数据功能来实现自动化管理,都让我茅塞顿开。我开始尝试在日常生活中运用这些方法,例如,为我的电子书按照作者、出版年份、主题等信息进行分类,为我拍摄的照片添加地点、人物、事件等元数据。这些实践不仅让我的数字文件变得井井有条,更重要的是,当我需要回顾某个特定时期或者查找某个特定内容时,效率得到了惊人的提升。

评分

在阅读过程中,我常常会停下来思考作者提出的观点,并尝试将其应用于我自己的工作和生活中。作者对“数据的元数据”这一概念的深入剖析,让我对“数据”本身有了更深层次的认识。我过去一直认为数据就是冰冷的代码和数字,但这本书让我明白了,数据本身也需要“被描述”,而这个描述信息,就是元数据。它就像给数据穿上了一件“外套”,让我们可以更轻松地识别、分类和使用它们。书中关于构建和维护高质量元数据的实践指南,对于任何希望提升数据治理能力的人来说,都具有极高的参考价值。我特别对作者提出的“数据血缘”概念印象深刻,它揭示了数据是如何一步步生成、转换和流动的,这对于追踪数据来源、保证数据质量以及进行根源分析至关重要。这本书不仅教授了“是什么”,更重要的是教会了“怎么做”。它提供了很多实用的方法和工具,让我可以立即着手改进我的数据管理流程。我开始重新审视我收集和处理信息的习惯,并尝试应用书中介绍的元数据实践,例如为我的文档添加更详细的描述信息,为我的照片添加关键词和拍摄日期等。这些看似微小的改变,却极大地提升了我查找和组织这些信息的效率。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有