产品特色
编辑推荐
百度外卖技术委员会主席力作
作者多年实际操盘经验总结
剖析大数据时代的“智能增长”的来龙去脉
从数据、模型、场景、团队等几个方面系统全面地总结了企业数据智能化的方法论
内容简介
《智能增长》共分 5 部分 :数据篇从智能驱动增长方案的基础出发,沿着实际工作链条,介绍数 据收集、加工、存储和访问 ;模型篇衔接基础数据到上层应用,全面介绍数据建模,包括生命 周期、RFM、AARRR 和地理信息模型 ;场景篇真正介绍智能增长怎么做,这里以完整的商业 运营链条为例拆解 9 大运营场景,从业务、财务和技术的角度详述增长实践 ;团队篇解释了数 据驱动增长在人物层面需要具备的必要因素 ;结语篇探讨了智能增长对经济的促进作用和作用方式。
《智能增长》适合所有从事移动互联网行业研发、产品和运营的人员阅读,对智能增长、互联网 + 经济分析预测的观察者也有借鉴意义。
作者简介
蒋凡,现任百度外卖技术委员会主席、总架构师,拉扎斯集团高-级科学家。主要研究方向是物流调度、个性化推荐、智能营销和画像建模。译有《推荐系统》(人民邮电出版社出版)和《推荐系统:技术、评估及高效算法 》(机械工业出版社出版)。作为“百度外卖智能调度”项目负责人,获得2017年“吴文俊人工智能科技进步奖”(企业技术创新工程项目)。
目录
第一部分 数据篇
第1章 数据收集 2
1.1 行为数据 3
1.1.1 传统获取方式 4
1.1.2 获取方式对比 5
1.1.3 无需埋点的数据收集 5
1.1.4 用户行为数据类型 7
1.2 交易数据 9
1.2.1 收集交易过程数据 9
1.2.2 收集交易累积数据 11
1.2.3 区分交易金额的组成 12
1.2.4 收集广告点击数据 13
1.3 标签数据 14
1.3.1 发现身份属性标签 15
1.3.2 在基础标签上加工 15
1.3.3 从交易行为提取标签 16
1.3.4 从数据挖掘建模输出 标签 16
第2章 数据加工 18
2.1 标准与格式 19
2.1.1 基本概念 19
2.1.2 无量纲化处理 20
2.1.3 多源数据融合 21
2.2 关联分析 23
2.2.1 概念 23
2.2.2 Apriori算法 24
2.2.3 应用关联分析 25
2.3 数据清洗 28
2.3.1 填补缺失值 28
2.3.2 数据平滑 30
2.3.3 数据造假 31
2.3.4 监测噪声数据 33
第3章 数据存储 35
3.1 分层与粒度 35
3.1.1 粒度划分标准 36
3.1.2 分层实现方法 37
3.1.3 智能增长的新视角 39
3.2 更新与时效 40
3.2.1 记录实时数据 40
3.2.2 数据更新与同步 41
3.2.3 时效性 42
3.3 搭建存储方案 43
3.3.1 HDFS数据库 43
3.3.2 NoSQL数据库 44
3.3.3 开发自有方案 46
第4章 数据访问 48
4.1 访问工具:正排与倒排 48
4.1.1 正排索引 48
4.1.2 倒排索引 52
4.2 衡量方法:查准与查全 54
4.2.1 定义 54
4.2.2 正排查全 55
4.2.3 正排查准 55
4.2.4 倒排查全 56
4.2.5 倒排查准 56
4.3 优化:性能与效率 57
4.3.1 数据库设计 57
4.3.2 SQL语句设计 59
第二部分 模型篇
第5章 生命周期模型 62
5.1 用户生命周期 62
5.1.1 划分标准 63
5.1.2 用户生命价值 64
5.1.3 生命周期运营 65
5.2 商户生命周期 67
5.2.1 划分标准 67
5.2.2 商户生命价值 69
5.2.3 生命周期运营 69
5.3 小结 71
第6章 RFM模型 73
6.1 定义 73
6.2 适用场景 75
6.2.1 客户管理 75
6.2.2 电商运营 76
6.2.3 服务升级 77
6.3 演变方向 78
6.3.1 多级指标细分 78
6.3.2 算法降维 79
第7章 AARRR模型 81
7.1 定义 81
7.2 适用场景和指标 82
7.2.1 下载量和激活量 83
7.2.2 用户获取成本 84
7.2.3 用户活跃度 84
7.2.4 用户留存率 85
7.2.5 用户平均收入 86
7.2.6 用户回报率 87
7.2.7 用户影响因子 88
7.3 小结 88
第8章 地理信息模型 90
8.1 意义 90
8.2 基础技术 91
8.2.1 地理坐标 92
8.2.2 地图定位 94
8.2.3 地图导航 94
8.3 适用场景 95
8.3.1 地址信息解析 96
8.3.2 基础位置描述 97
8.3.3 周边POI检索 98
8.3.4 高精度定位服务 99
8.3.5 个性化感知 100
8.4 演变方向 101
8.4.1 室内定位精准度 101
8.4.2 POI位置语义化 102
第三部分 场景篇
第9章 如何持续获得新用户 104
9.1 意义 104
9.2 从0到10 000,圈定种子用户 105
9.2.1 采用邀请机制 106
9.2.2 引起社区关注 106
9.3 从10 000到1000万,构建增长 机制 107
9.3.1 竞争群体增长 107
9.3.2 延伸品类增长 108
9.3.3 相近地址增长 109
9.3.4 社交关系增长 110
9.4 评估与反馈 111
9.4.1 降低竞品用户的获取 成本 112
9.4.2 提高附近用户的激活 比例 112
9.4.3 提高延伸用户的活跃 程度 113
9.4.4 提高社交用户的影响 能力 114
9.4.5 拉新效果评估矩阵 114
9.5 小结 115
第10章 谁是你的明星商户 116
10.1 意义 116
10.2 拓荒阶段 117
10.2.1 动销率与展现率 118
10.2.2 吸引能力:平衡动销 和展现 118
10.3 发展阶段 119
10.3.1 新客导流数量与质量 119
10.3.2 导流能力:平衡数量 与质量 120
10.4 相持阶段 120
10.4.1 客单价与客单量 121
10.4.2 扩张能力:平衡单价 与单量 121
10.5 稳定阶段 122
10.5.1 投资回报率与营业利 润率 122
10.5.2 盈利能力:跨越盈亏 平衡线 123
10.6 小结 124
第11章 何日君再来 125
11.1 背景 125
11.2 留存分析工具 127
11.2.1 目标用户定格测算 分析 127
11.2.2 选定用户时序演化 分析 129
11.3 挽回流失用户 131
11.3.1 流失的定义和分类 131
11.3.2 流失率预测模型 132
11.3.3 干预流失过程 133
11.3.4 流失用户激活效应 133
11.4 小结 134
第12章 差异化定价 136
12.1 意义 136
12.2 根据服务区分定价 138
12.2.1 一服务一价 138
12.2.2 创造差异服务 139
12.3 根据用户区分定价 140
12.3.1 看到不同价格 140
12.3.2 派发不同红包 140
12.4 根据时间区分定价 141
12.4.1 潮汐规律 141
12.4.2 峰值效应 142
12.5 小结 144
第13章 缩短用户决策路径 145
13.1 决策路径上的技术链条 146
13.2 搜索技术 147
13.2.1 查询词分析 147
13.2.2 查询词变换 149
13.2.3 检索结果扩展 150
13.3 排序技术 151
13.3.1 社交类 151
13.3.2 消费类 152
13.4 推荐技术 152
13.4.1 技术选型 153
13.4.2 技术挑战 157
13.5 小结 160
第14章 营造虚拟经济循环 161
14.1 背景 161
14.2 虚拟商品定价 163
14.2.1 信用积分体系 163
14.2.2 道具交易体系 164
14.3 虚拟管理激励 165
14.3.1 调节服务难度 166
14.3.2 调节服务质量 167
14.4 虚拟资源竞价 169
14.4.1 发现虚拟资源 169
14.4.2 找到竞价者 170
14.4.3 估算竞争价格 171
14.5 小结 171
第15章 挤出繁荣里的泡沫 173
15.1 什么是刷单 174
15.1.1 刷单形态 174
15.1.2 作弊手段 175
15.2 加强数据校验 177
15.2.1 唯一性验证 177
15.2.2 常驻点验证 178
15.2.3 硬件验证 179
15.3 发现数据异常 180
15.3.1 短期频繁行为 180
15.3.2 批量雷同行为 181
15.3.3 抱团趋同 182
15.4 制止作弊行为 182
15.4.1 规则系统 182
15.4.2 机器建模 183
15.4.3 避免误伤 184
15.5 小结 184
第16章 为商户赋能 186
16.1 选地址 187
16.1.1 找到旺铺位置 187
16.1.2 划定服务范围 188
16.2 选商品 189
16.2.1 知己知彼找爆品 189
16.2.2 商品的生命周期 190
16.3 选客群 190
16.3.1 定制目标用户 190
16.3.2 提高揽客质量 191
16.3.3 降低揽客成本 192
16.4 小结 192
第17章 调度一盘棋 194
17.1 调度模式分类 195
17.1.1 单地串行调度 196
17.1.2 单地并行调度 196
17.1.3 双地并行调度 197
17.2 物流调度决策 198
17.2.1 多目标优化 199
17.2.2 分层建模降维 200
17.2.3 云端虚拟调度 201
17.2.4 配送耗时预估 202
17.2.5 可视化平台 203
17.3 运力供需分配 204
17.3.1 需求预测与跨时空 调配 205
17.3.2 极端条件运力预警 分配 205
17.4 小结 206
第四部分 团队篇
第18章 榜样的力量 208
18.1 Facebook增长团队 209
18.1.1 组织构成 209
18.1.2 主要经验 210
18.2 美团大数据团队 210
18.2.1 组织构成 210
18.2.2 主要经验 211
18.3 腾讯大数据团队 212
18.3.1 组织构成 212
18.3.2 主要经验 212
18.4 GrowingIO大数据团队 213
18.4.1 组织构成 213
18.4.2 主要经验 214
18.5 京东大数据团队 214
18.5.1 组织构成 215
18.5.2 主要经验 215
18.6 阿里巴巴数据平台事业部 216
18.6.1 组织构成 216
18.6.2 主要经验 217
第19章 组建增长团队 218
19.1 增长团队组织架构 218
19.1.1 增长团队内部成员 218
19.1.2 增长团队相关角色 220
19.1.3 团队合作方式 223
19.2 发挥数据科学家的作用 224
19.2.1 数据科学家做什么 225
19.2.2 数据科学家怎么做 226
19.3 常见陷阱与经验 227
19.3.1 避免大数据浮肿 227
19.3.2 沟通部门间障碍 227
19.3.3 防范全面建设 228
第五部分 结语篇
第20章 增长的力量 232
20.1 智能增长对经济的意义 232
20.1.1 互联网改造工业经济 232
20.1.2 互联网经济到智能经济的过渡 233
20.1.3 智能增长的本质 234
20.2 智能增长的阶段 235
20.2.1 早期积累 236
20.2.2 快速发展 236
20.2.3 精细运营 237
20.3 人的未来 238
20.3.1 被机器智能替代 239
20.3.2 做机器做不了的 240
20.3.3 驾驭机器智能 240
20.3.4 增长的代价 241
后记 242
精彩书摘
《智能增长》:
倒排索引表以物品的属性字段及属性值作为关键字进行索引,索引表返回关键字对应的物品集合,这些物品具有相应的属性字段,并且这些字段的属性值符合查询要求。现实数据都是以物品为最小单元加入数据库,每个物品所具有的属性字段和属性值也各不相同,这样从倒排关系看到的属性字段和属性值对应的物品数量是在动态变化的,所以倒排索引表的建立和维护都较为复杂。倒排索引的优势则在于,能够一次得到查询关键字所对应的所有物品,它的效率高于正排索引表。
倒排索引组织数据方法的关键在于从属性描述值到被描述物品的访问方式。也就是系统基于物品属性字段的数值建立索引表,为每一个数值对应的物品集合建立一条拉链,依次填人每个物品。若有新的物品加入,系统则找到该物品所有属性数值对应的拉链,一一加入进去。若有物品删除,系统则找到该物品所在的所有拉链,一一将其删除。但这样在获得查询便利的同时,也损失了建立和维护倒排索引表的可扩展性。实际上,如果数据库需要频繁更新,系统根本没有办法维持这样一个建库开销大于查询开销的数据库。
……
智能增长 epub pdf mobi txt 电子书 下载 2025
智能增长 下载 epub mobi pdf txt 电子书 2025