docs/%E7%AB%9E%E5%93%81%E5%8F%82%E8%80%83%E6%96%87%E6%A1%A3/DynamicYield-%E7%94%A8%E6%88%B7%E6%95%B0%E6%8D%AE%E8%8E%B7%E5%8F%96%E6%8A%80%E6%9C%AF%E6%96%B9%E6%A1%88.md

# Dynamic Yield：用户数据获取技术方案（拆解版）
> 目标：拆解 Dynamic Yield（DY）在“用户数据获取/实时决策/实验优化”的数据层实现，方便你们对标自研个性化引擎 SaaS。
>
> 说明：DY 的部分文档与实现细节面向客户/合作伙伴账号。本文基于公开资料与行业主流 DY 类产品的落地方式提炼，字段/端点级细节需以你们获取到的 DY 官方文档与 PoC 抓包为准。
---
## 1. DY 的数据获取 = 事件采集 + 商品/内容 feed + 身份合并
### 1.1 事件采集（Web/App）
**目的**：实时构建 session 意图与短期偏好，驱动 onsite personalization、推荐、A/B 测试。
**典型事件**（行业通用）：
- `page_view`
- `product_view`
- `add_to_cart`
- `checkout_start`
- `purchase`
- `search`
### 1.2 商品/内容 Feed
**目的**：推荐与决策需要“可用的候选集合”，feed 的字段质量直接影响推荐与排序。
**典型字段**：
- product_id / sku
- title/description/image
- category/attributes
- price/sale_price
- availability/inventory
- tags/brand
### 1.3 用户属性与业务事实
**目的**：把长期价值与偏好（RFM/LTV/会员等级/历史购买）进入用户画像，支撑更强的策略与实验分层。
---
## 2. 数据采集方式（DY 类产品典型实现）
### 2.1 前端 Tag（DY Tag / JS）
**作用**：
- 为访客分配匿名 ID（cookie/localStorage 一方）
- 采集页面上下文与行为事件
- 拉取“决策结果”（推荐/个性化变体/优惠）并渲染
- 记录实验曝光与转化（A/B、MVT）
**工程要点**：
- 异步加载、避免阻塞渲染
- 事件幂等（event_id）
- 与服务端订单事实对账（purchase 最好 S2S 再补一份）
### 2.2 服务端 S2S（转化/订单事实）
**作用**：
- 提升 purchase/退款/取消的准确性与一致性
- 支撑 server-side personalization 场景（例如在 edge/SSR 输出个性化）
**关键字段建议**：
- order_id（幂等）
- customer identifiers（customer_id / email_sha256 / phone_sha256）
- items、value、currency、timestamp
### 2.3 平台/工具集成（CDP/Email/Ads）
DY 常作为“决策层”，因此会对接：
- CDP（统一事件流）
- Email/SMS（把推荐/人群输出到触达渠道）
- Ads（把人群同步到投放平台、回传转化做归因）
---
## 3. 身份识别与跨设备（DY 类产品常见策略）
### 3.1 匿名到已知
触发点：
- 登录
- 留资（订阅）
- 下单
做法：
- 在“识别事件”发生时，把当前匿名 cookie id 与已知标识（email/phone/customer_id）绑定
- 将历史匿名行为合并到已知画像
### 3.2 跨设备
- **确定性优先**：email/phone/customer_id
- **匹配增强**：哈希 PII + click id 回传给广告平台，借助平台跨设备图谱提升归因（DY/你们都无法直接拿到平台图谱细节）
---
## 4. 实验与归因：为什么 DY 必须“自己采 + 自己记曝光”？
DY 的 A/B 测试与个性化要成立，必须同时拥有：
- **曝光事件**：用户看到了哪个变体/哪个推荐位（exposure/impression）
- **行为/转化事件**：点击、加购、购买
因此在数据获取层，DY 类系统会强制：
- 在前端记录“谁看到什么”（曝光）
- 在订单侧确认“最终发生什么”（purchase/refund）
这也是你们自研时必须具备的两条事件链路。
---
## 5. 去重、延迟与一致性
- 曝光/点击等事件：秒级进入决策系统（用于实时策略）
- 订单事实：以 order_id 幂等，分钟级确认并可反向修正（退款/取消）
- 报表与分析：小时级/天级聚合
---
## 6. 你们自研 SaaS 的可复用点（对照 DY）
- 把“决策层（实时个性化）”与“事实层（订单/客户/商品）”拆开建管道
- 曝光事件是 A/B 与个性化归因的基础（必须采集）
- purchase 必须 S2S 幂等回传（order_id）
- 广告平台闭环：click id + S2S 回传 + 报表富化（见 `docs/用户匹配与外部数据打通-平台官方机制提权.md`）