Blame view

docs/blog/全渠道数据整合、外部数据打通/竞品参考文档/Bloomreach-用户数据获取技术方案.md 5.29 KB
fbc7f114   tangwang   docs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
  # Bloomreach:用户数据获取技术方案(拆解版:Engagement / Discovery)
  
  > 目标:拆解 Bloomreach 在“用户数据获取/统一/激活”的技术路径,覆盖 Bloomreach Engagement(原 Exponea,偏 CDP+营销自动化)与 Bloomreach Discovery(偏搜索/商品发现)。
  >
  > 说明:Bloomreach 的开发者文档体系较大,且部分内容面向客户/合作伙伴账号。本文以公开资料与行业通用实现方式做结构化提炼;字段/端点级细节请以你们实际拿到的 Bloomreach 官方文档与 PoC 验证为准。
  
  ---
  
  ## 1. Bloomreach 的“取数目标”分两条产品线
  
  ### 1.1 Engagement(CDP / Marketing Automation)
  
  **核心目标**:把多渠道事件与用户属性汇总为 Customer 360,并在邮件/短信/推送/站内等渠道做实时触达与分群。
  
  ### 1.2 Discovery(Search / Merchandising)
  
  **核心目标**:让搜索/类目页/推荐能基于:
  
  - 高质量商品目录
  - 用户行为与查询意图(站内搜索词、点击、加购、购买)
  
  做排序与推荐优化。
  
  ---
  
  ## 2. 数据获取的 4 条主通道(Bloomreach 常见架构)
  
  ### 2.1 Web 事件采集(JS SDK / Tag)
  
  **用途**:采集站内行为(浏览、点击、搜索、加购、结账开始等),并生成匿名 ID / 会话 ID。
  
  **你能获得的数据类型**
  
  - 页面/商品/类目上下文(URL、product_id、category、price 等)
  - 行为事件序列(view → add_to_cart → purchase)
  - 会话/设备信号(device、browser、language、geo 近似等)
  
  ### 2.2 Mobile 事件采集(iOS/Android SDK,可选)
  
  **用途**:App 内事件与身份(device id / login id)进入同一用户画像,用于跨设备与多渠道触达。
  
  ### 2.3 服务端 S2S 事件与属性导入(Events API / Attributes Import)
  
  **用途**
  
  - 订单支付、退款、取消等“最终事实”由服务端回传,保证一致性
  - CRM/会员/线下交易等属性导入,丰富 Customer 360
  
  **典型字段(你们实现时建议对齐)**
  
  - `customer_id` / `email_sha256` / `phone_sha256`
  - `event_name`(purchase/refund/loyalty_level_changed…)
  - `event_time`
  - `order_id`(幂等)
  - `items[]`(sku/qty/price/category)
  - `consent`(是否允许营销/广告/分析)
  
  ### 2.4 商品目录/内容目录导入(Feed / Connector)
  
  **Engagement 视角**
  
  - 把 catalog 作为“推荐与模板渲染”的素材库(邮件/站内推荐等)
  
  **Discovery 视角**
  
  - catalog 是搜索与排序的基础,字段质量直接决定搜索体验(类目、属性、库存、价格、同义词、品牌等)
  
  ---
  
  ## 3. 身份识别与用户合并(Engagement 的关键能力)
  
  ### 3.1 匿名 → 已知的确定性合并
  
  典型触发点:
  
  - 登录
  - 留资(订阅)
  - 下单
  
  合并策略(常见):
  
  - 以 email/phone/customer_id 作为 canonical user
  - 把匿名行为历史挂接到已知用户
  
  ### 3.2 跨渠道身份桥(Email/SMS/Push/Ads)
  
  Bloomreach Engagement 这类平台的优势通常在于:
  
  - 同一用户在不同渠道的触达与互动(open/click/subscribe/unsubscribe)都能回流到同一 profile
  - 形成“触达 → 行为 → 转化”的闭环指标
  
  ---
  
  ## 4. 外部数据打通(广告/邮件/数据仓库)常见做法
  
  ### 4.1 广告平台(Meta/Google/TikTok)
  
  Engagement 类平台通常会:
  
  - 读取/写入广告受众(分群同步到平台)
  - 通过 click id + S2S 转化回传 + 报表拉取做归因与 ROI 分析
  
  > 具体“用户匹配提权”方法可复用你们仓库文档:`docs/用户匹配与外部数据打通-平台官方机制提权.md`。
  
  ### 4.2 数据仓库/数据云(例如 Snowflake)
  
  公开资料显示 Bloomreach 强调与数据云/仓库的对接,以便:
  
  - 直接读取企业已沉淀的 customer attributes / events / catalog
  - 把分群与触达结果回写(形成数据闭环)
  
  工程上对应两类模式:
  
  - **批量同步**:按天/小时把表导入/导出(适合大体量)
  - **准实时**:流式/CDC(适合关键事件与实时触达)
  
  ---
  
  ## 5. 去重、延迟与一致性(Engagement/Discovery 共性)
  
  - **幂等键**:订单事件用 `order_id`;行为事件用 `event_id`
  - **实时层**:站内行为秒级进入用户画像(站内个性化、触发营销)
  - **准实时/离线层**:模型训练、用户聚类、商品相似度等批处理
  - **反向修正**:退款/取消会修正 LTV 与归因(必须接入)
  
  ---
  
  ## 6. 你们自研 SaaS 的可复用点(对照 Bloomreach)
  
  - 把“Engagement(CDP/营销)”与“Discovery(搜索/商品发现)”的数据需求分层
  - 事件采集 + S2S 事实回传 + Catalog feed 是最稳定三件套
  - 身份合并:匿名 → email/phone/customer_id(确定性优先)
  - 触达互动回流(open/click/退订)是“营销型个性化”的关键外部信号
  
323a720b   tangwang   docs
135
136
137
138
139
140
141
142
143
144
145
  ---
  
  ## 7. 参考链接(官方/公开入口)
  
  - **Bloomreach**
    - [Bloomreach 文档中心(入口)](https://documentation.bloomreach.com/)
    - [Bloomreach Discovery Web SDK(公开文档)](https://bloomreach.github.io/discovery-web-sdk/index.html)
    - [Bloomreach 官网 Docs(入口)](https://www.bloomreach.com/en/docs)
  - **关联阅读(本仓库)**
    - `docs/全渠道数据整合-广告平台S2S对接手册.md`
    - `docs/用户匹配与外部数据打通-平台官方机制提权.md`
fbc7f114   tangwang   docs