Blame view

docs/搜索API对接指南.md 16.6 KB
b73baf85   tangwang   撰写接口文档
1
2
3
4
5
6
7
8
  # 搜索API接口对接指南
  
  本文档为搜索服务的使用方提供完整的API对接指南,包括接口说明、请求参数、响应格式和使用示例。
  
  ## 目录
  
  1. [快速开始](#快速开始)
  2. [接口概览](#接口概览)
af249836   tangwang   文档完善
9
10
11
  3. [搜索接口](#搜索接口)
  4. [响应格式说明](#响应格式说明)
  5. [常见场景示例](#常见场景示例)
b73baf85   tangwang   撰写接口文档
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
  
  ---
  
  ## 快速开始
  
  ### 基础信息
  
  - **Base URL**: `http://your-domain:6002` 或 `http://120.76.41.98:6002`
  - **协议**: HTTP/HTTPS
  - **数据格式**: JSON
  - **字符编码**: UTF-8
  - **请求方法**: POST(搜索接口)
  
  ### 最简单的搜索请求
  
  ```bash
97a5d59d   tangwang   文档修改
28
  curl -X POST "http://120.76.41.98:6002/search/" \
b73baf85   tangwang   撰写接口文档
29
    -H "Content-Type: application/json" \
97a5d59d   tangwang   文档修改
30
31
    -H "X-Tenant-ID: 2" \
    -d '{"query": "芭比娃娃"}'
b73baf85   tangwang   撰写接口文档
32
33
  ```
  
b0ad8e89   tangwang   文档完善
34
  ### curl示例:带过滤与分页
b73baf85   tangwang   撰写接口文档
35
  
b0ad8e89   tangwang   文档完善
36
  ```bash
97a5d59d   tangwang   文档修改
37
  curl -X POST "http://120.76.41.98:6002/search/" \
b0ad8e89   tangwang   文档完善
38
    -H "Content-Type: application/json" \
97a5d59d   tangwang   文档修改
39
    -H "X-Tenant-ID: 2" \
b0ad8e89   tangwang   文档完善
40
    -d '{
97a5d59d   tangwang   文档修改
41
      "query": "芭比娃娃",
b0ad8e89   tangwang   文档完善
42
43
      "size": 5,
      "from": 10,
97a5d59d   tangwang   文档修改
44
45
46
47
    "range_filters": {
      "min_price": {
        "gte": 50,
        "lte": 200
b0ad8e89   tangwang   文档完善
48
      },
97a5d59d   tangwang   文档修改
49
50
51
52
      "create_time": {
        "gte": "2020-01-01T00:00:00Z" 
      }
    },
b0ad8e89   tangwang   文档完善
53
54
55
      "sort_by": "min_price",
      "sort_order": "asc"
    }'
b73baf85   tangwang   撰写接口文档
56
57
  ```
  
97a5d59d   tangwang   文档修改
58
  ### curl示例:开启分面
b73baf85   tangwang   撰写接口文档
59
  
b0ad8e89   tangwang   文档完善
60
  ```bash
97a5d59d   tangwang   文档修改
61
  curl -X POST "http://120.76.41.98:6002/search/" \
b0ad8e89   tangwang   文档完善
62
    -H "Content-Type: application/json" \
97a5d59d   tangwang   文档修改
63
    -H "X-Tenant-ID: 2" \
b0ad8e89   tangwang   文档完善
64
65
66
    -d '{
      "tenant_id": "demo-tenant",
      "query": "芭比娃娃",
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
67
      "facets": ["category.keyword", "vendor.keyword"],
97a5d59d   tangwang   文档修改
68
      "min_score": 0.2
b0ad8e89   tangwang   文档完善
69
    }'
b73baf85   tangwang   撰写接口文档
70
71
72
73
74
75
  ```
  
  ---
  
  ## 接口概览
  
3cf1c64d   tangwang   文档完善
76
77
78
79
80
81
  | 接口 | HTTP Method | Endpoint | 
  |------|------|------|
  | 搜索 | POST | `/search/` | 
  | 搜索建议(框架,暂未实现) | GET | `/search/suggestions` | 
  | 获取文档 | GET | `/search/{doc_id}` | 
  | 健康检查 | GET | `/admin/health` | 
b73baf85   tangwang   撰写接口文档
82
83
84
  
  ---
  
af249836   tangwang   文档完善
85
  ## 搜索接口
b73baf85   tangwang   撰写接口文档
86
87
88
89
90
91
92
93
94
95
96
97
  
  ### 接口信息
  
  - **端点**: `POST /search/`
  - **描述**: 执行文本搜索查询,支持多语言、布尔表达式、过滤器和分面搜索
  
  ### 请求参数
  
  #### 完整请求体结构
  
  ```json
  {
b0ad8e89   tangwang   文档完善
98
    "tenant_id": "string (required)",
b73baf85   tangwang   撰写接口文档
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
    "query": "string (required)",
    "size": 10,
    "from": 0,
    "filters": {},
    "range_filters": {},
    "facets": [],
    "sort_by": "string",
    "sort_order": "desc",
    "min_score": 0.0,
    "debug": false,
    "user_id": "string",
    "session_id": "string"
  }
  ```
  
  #### 参数详细说明
  
  | 参数 | 类型 | 必填 | 默认值 | 说明 |
  |------|------|------|--------|------|
af249836   tangwang   文档完善
118
119
120
121
122
123
124
125
126
127
128
129
130
  | `tenant_id` | string | Y | - | 租户ID,用于隔离不同站点或客户的数据 |
  | `query` | string | Y | - | 搜索查询字符串,支持布尔表达式(AND, OR, RANK, ANDNOT) |
  | `size` | integer | N | 10 | 返回结果数量(1-100) |
  | `from` | integer | N | 0 | 分页偏移量(用于分页) |
  | `filters` | object | N | null | 精确匹配过滤器(见下文) |
  | `range_filters` | object | N | null | 数值范围过滤器(见下文) |
  | `facets` | array | N | null | 分面配置(见下文) |
  | `sort_by` | string | N | null | 排序字段名(如 `min_price`, `max_price`, `title`) |
  | `sort_order` | string | N | "desc" | 排序方向:`asc`(升序)或 `desc`(降序) |
  | `min_score` | float | N | null | 最小相关性分数阈值 |
  | `debug` | boolean | N | false | 是否返回调试信息 |
  | `user_id` | string | N | null | 用户ID(用于个性化,预留) |
  | `session_id` | string | N | null | 会话ID(用于分析,预留) |
b73baf85   tangwang   撰写接口文档
131
132
133
134
135
136
137
138
139
140
141
  
  ### 过滤器详解
  
  #### 1. 精确匹配过滤器 (filters)
  
  用于精确匹配或多值匹配(OR 逻辑)。
  
  **格式**:
  ```json
  {
    "filters": {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
142
143
144
      "category.keyword": "玩具",                    // 单值:精确匹配
      "vendor.keyword": ["乐高", "孩之宝"],          // 数组:匹配任意值(OR)
      "tags.keyword": "益智玩具"                     // 单值:精确匹配
b73baf85   tangwang   撰写接口文档
145
146
147
148
149
150
151
152
153
154
155
    }
  }
  ```
  
  **支持的值类型**:
  - 字符串:精确匹配
  - 整数:精确匹配
  - 布尔值:精确匹配
  - 数组:匹配任意值(OR 逻辑)
  
  **常用过滤字段**:
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
156
157
158
  - `category.keyword`: 类目
  - `vendor.keyword`: 品牌/供应商
  - `tags.keyword`: 标签
b73baf85   tangwang   撰写接口文档
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
  
  #### 2. 范围过滤器 (range_filters)
  
  用于数值字段的范围过滤。
  
  **格式**:
  ```json
  {
    "range_filters": {
      "min_price": {
        "gte": 50,    // 大于等于
        "lte": 200    // 小于等于
      },
      "max_price": {
        "gt": 100     // 大于
      },
      "create_time": {
        "gte": "2024-01-01T00:00:00Z"  // 日期时间字符串
      }
    }
  }
  ```
  
  **支持的操作符**:
  - `gte`: 大于等于 (>=)
  - `gt`: 大于 (>)
  - `lte`: 小于等于 (<=)
  - `lt`: 小于 (<)
  
  **注意**: 至少需要指定一个操作符。
  
  **常用范围字段**:
  - `min_price`: 最低价格
  - `max_price`: 最高价格
  - `compare_at_price`: 原价
  - `create_time`: 创建时间
  - `update_time`: 更新时间
  
  #### 3. 分面配置 (facets)
  
  用于生成分面统计(分组聚合),常用于构建筛选器UI。
  
  **简单模式**(字符串数组):
  ```json
  {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
204
    "facets": ["category.keyword", "vendor.keyword"]
b73baf85   tangwang   撰写接口文档
205
206
207
208
209
210
211
212
  }
  ```
  
  **高级模式**(配置对象数组):
  ```json
  {
    "facets": [
      {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
213
        "field": "category.keyword",
b73baf85   tangwang   撰写接口文档
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
        "size": 15,
        "type": "terms"
      },
      {
        "field": "min_price",
        "type": "range",
        "ranges": [
          {"key": "0-50", "to": 50},
          {"key": "50-100", "from": 50, "to": 100},
          {"key": "100-200", "from": 100, "to": 200},
          {"key": "200+", "from": 200}
        ]
      }
    ]
  }
  ```
  
  **分面配置参数**:
  - `field`: 字段名(必填)
  - `size`: 返回的分组数量(默认:10,范围:1-100)
  - `type`: 分面类型,`terms`(分组统计)或 `range`(范围统计)
  - `ranges`: 范围定义(仅当 type='range' 时需要)
  
  ### 布尔表达式语法
  
  搜索查询支持布尔表达式,提供更灵活的搜索能力。
  
  **支持的操作符**:
  
  | 操作符 | 描述 | 示例 |
  |--------|------|------|
  | `AND` | 所有词必须匹配 | `玩具 AND 乐高` |
  | `OR` | 任意词匹配 | `芭比 OR 娃娃` |
  | `ANDNOT` | 排除特定词 | `玩具 ANDNOT 电动` |
  | `RANK` | 排序加权(不强制匹配) | `玩具 RANK 乐高` |
  | `()` | 分组 | `玩具 AND (乐高 OR 芭比)` |
  
  **操作符优先级**(从高到低):
  1. `()` - 括号
  2. `ANDNOT` - 排除
  3. `AND` - 与
  4. `OR` - 或
  5. `RANK` - 排序
  
  **示例**:
  ```
  "芭比娃娃"                    // 简单查询
  "玩具 AND 乐高"               // AND 查询
  "芭比 OR 娃娃"                // OR 查询
  "玩具 ANDNOT 电动"            // 排除查询
  "玩具 AND (乐高 OR 芭比)"      // 复杂查询
  ```
  
  ---
  
b73baf85   tangwang   撰写接口文档
269
270
271
272
273
274
275
276
  ## 响应格式说明
  
  ### 标准响应结构
  
  ```json
  {
    "results": [
      {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
277
        "spu_id": "12345",
b73baf85   tangwang   撰写接口文档
278
279
280
281
        "title": "芭比时尚娃娃",
        "handle": "barbie-doll",
        "description": "高品质芭比娃娃",
        "vendor": "美泰",
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
282
        "category": "玩具",
b73baf85   tangwang   撰写接口文档
283
284
285
286
287
288
        "tags": "娃娃, 玩具, 女孩",
        "price": 89.99,
        "compare_at_price": 129.99,
        "currency": "USD",
        "image_url": "https://example.com/image.jpg",
        "in_stock": true,
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
289
        "skus": [
b73baf85   tangwang   撰写接口文档
290
          {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
291
            "sku_id": "67890",
b73baf85   tangwang   撰写接口文档
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
            "title": "粉色款",
            "price": 89.99,
            "compare_at_price": 129.99,
            "sku": "BARBIE-001",
            "stock": 100,
            "options": {
              "option1": "粉色",
              "option2": "标准款"
            }
          }
        ],
        "relevance_score": 8.5
      }
    ],
    "total": 118,
    "max_score": 8.5,
    "facets": [
      {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
310
311
        "field": "category.keyword",
        "label": "category.keyword",
b73baf85   tangwang   撰写接口文档
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
        "type": "terms",
        "values": [
          {
            "value": "玩具",
            "label": "玩具",
            "count": 85,
            "selected": false
          }
        ]
      }
    ],
    "query_info": {
      "original_query": "芭比娃娃",
      "detected_language": "zh",
      "translations": {
        "en": "barbie doll"
      }
    },
    "suggestions": [],
    "related_searches": [],
    "took_ms": 45,
    "performance_info": null,
    "debug_info": null
  }
  ```
  
  ### 响应字段说明
  
  | 字段 | 类型 | 说明 |
  |------|------|------|
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
342
343
  | `results` | array | 搜索结果列表(SpuResult对象数组) |
  | `results[].spu_id` | string | SPU ID |
b73baf85   tangwang   撰写接口文档
344
345
  | `results[].title` | string | 商品标题 |
  | `results[].price` | float | 价格(min_price) |
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
346
  | `results[].skus` | array | SKU列表 |
b73baf85   tangwang   撰写接口文档
347
348
349
350
351
352
353
  | `results[].relevance_score` | float | 相关性分数 |
  | `total` | integer | 匹配的总文档数 |
  | `max_score` | float | 最高相关性分数 |
  | `facets` | array | 分面统计结果 |
  | `query_info` | object | 查询处理信息 |
  | `took_ms` | integer | 搜索耗时(毫秒) |
  
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
354
  ### SpuResult字段说明
b73baf85   tangwang   撰写接口文档
355
356
357
  
  | 字段 | 类型 | 说明 |
  |------|------|------|
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
358
  | `spu_id` | string | SPU ID |
b73baf85   tangwang   撰写接口文档
359
360
361
362
  | `title` | string | 商品标题 |
  | `handle` | string | 商品URL handle |
  | `description` | string | 商品描述 |
  | `vendor` | string | 供应商/品牌 |
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
363
  | `category` | string | 类目 |
b73baf85   tangwang   撰写接口文档
364
365
366
367
368
  | `tags` | string | 标签 |
  | `price` | float | 价格(min_price) |
  | `compare_at_price` | float | 原价 |
  | `currency` | string | 货币单位(默认USD) |
  | `image_url` | string | 主图URL |
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
369
370
  | `in_stock` | boolean | 是否有库存(任意SKU有库存即为true) |
  | `skus` | array | SKU 列表 |
b73baf85   tangwang   撰写接口文档
371
372
  | `relevance_score` | float | 相关性分数 |
  
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
373
  ### SkuResult字段说明
b73baf85   tangwang   撰写接口文档
374
375
376
  
  | 字段 | 类型 | 说明 |
  |------|------|------|
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
377
378
  | `sku_id` | string | SKU ID |
  | `title` | string | SKU标题 |
b73baf85   tangwang   撰写接口文档
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
  | `price` | float | 价格 |
  | `compare_at_price` | float | 原价 |
  | `sku` | string | SKU编码 |
  | `stock` | integer | 库存数量 |
  | `options` | object | 选项(颜色、尺寸等) |
  
  ---
  
  ## 常见场景示例
  
  ### 场景1:商品列表页搜索
  
  **需求**: 搜索"玩具",按价格从低到高排序,显示前20个结果
  
  ```json
  {
    "query": "玩具",
    "size": 20,
    "from": 0,
    "sort_by": "min_price",
    "sort_order": "asc"
  }
  ```
  
  ### 场景2:带筛选的商品搜索
  
  **需求**: 搜索"玩具",筛选类目为"益智玩具",价格在50-200之间
  
  ```json
  {
    "query": "玩具",
    "size": 20,
    "filters": {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
412
      "category.keyword": "益智玩具"
b73baf85   tangwang   撰写接口文档
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
    },
    "range_filters": {
      "min_price": {
        "gte": 50,
        "lte": 200
      }
    }
  }
  ```
  
  ### 场景3:带分面的商品搜索
  
  **需求**: 搜索"玩具",获取类目和品牌的分面统计,用于构建筛选器
  
  ```json
  {
    "query": "玩具",
    "size": 20,
    "facets": [
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
432
433
      "category.keyword",
      "vendor.keyword"
b73baf85   tangwang   撰写接口文档
434
435
436
437
438
439
440
441
442
443
444
445
446
    ]
  }
  ```
  
  ### 场景4:多条件组合搜索
  
  **需求**: 搜索"玩具",筛选多个品牌,价格范围,并获取分面统计
  
  ```json
  {
    "query": "玩具",
    "size": 20,
    "filters": {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
447
      "vendor.keyword": ["乐高", "孩之宝", "美泰"]
b73baf85   tangwang   撰写接口文档
448
449
450
451
452
453
454
455
456
    },
    "range_filters": {
      "min_price": {
        "gte": 50,
        "lte": 200
      }
    },
    "facets": [
      {
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
457
        "field": "category.keyword",
b73baf85   tangwang   撰写接口文档
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
        "size": 15
      },
      {
        "field": "min_price",
        "type": "range",
        "ranges": [
          {"key": "0-50", "to": 50},
          {"key": "50-100", "from": 50, "to": 100},
          {"key": "100-200", "from": 100, "to": 200},
          {"key": "200+", "from": 200}
        ]
      }
    ],
    "sort_by": "min_price",
    "sort_order": "asc"
  }
  ```
  
  ### 场景5:布尔表达式搜索
  
  **需求**: 搜索包含"玩具"和"乐高"的商品,排除"电动"
  
  ```json
  {
    "query": "玩具 AND 乐高 ANDNOT 电动",
    "size": 20
  }
  ```
  
  ### 场景6:分页查询
  
  **需求**: 获取第2页结果(每页20条)
  
  ```json
  {
    "query": "玩具",
    "size": 20,
    "from": 20
  }
  ```
  
  ---
  
b73baf85   tangwang   撰写接口文档
501
502
  ---
  
4a677843   tangwang   文档完善
503
504
505
506
507
508
509
510
511
512
513
  ## 其他接口
  
  ### 搜索建议(框架)
  
  - **端点**: `GET /search/suggestions`
  - **描述**: 返回搜索建议(自动补全/热词)。当前为框架实现,接口和响应格式已经固定,可平滑扩展。
  
  #### 查询参数
  
  | 参数 | 类型 | 必填 | 默认值 | 描述 |
  |------|------|------|--------|------|
af249836   tangwang   文档完善
514
515
516
  | `q` | string | Y | - | 查询字符串(至少 1 个字符) |
  | `size` | integer | N | 5 | 返回建议数量(1-20) |
  | `types` | string | N | `query` | 建议类型(逗号分隔):`query`, `product`, `category`, `brand` |
4a677843   tangwang   文档完善
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
  
  #### 响应示例
  
  ```json
  {
    "query": "芭",
    "suggestions": [
      {
        "text": "芭比娃娃",
        "type": "query",
        "highlight": "<em></em>比娃娃",
        "popularity": 850
      }
    ],
    "took_ms": 5
  }
  ```
  
  #### 请求示例
  
  ```bash
  curl "http://localhost:6002/search/suggestions?q=芭&size=5&types=query,product"
  ```
  
  ---
  
  ### 即时搜索(框架)
  
  - **端点**: `GET /search/instant`
  - **描述**: 边输入边搜索,采用轻量参数响应当前输入。底层复用标准搜索能力。
  
  #### 查询参数
  
  | 参数 | 类型 | 必填 | 默认值 | 描述 |
  |------|------|------|--------|------|
af249836   tangwang   文档完善
552
553
  | `q` | string | Y | - | 搜索查询(至少 2 个字符) |
  | `size` | integer | N | 5 | 返回结果数量(1-20) |
4a677843   tangwang   文档完善
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
  
  #### 请求示例
  
  ```bash
  curl "http://localhost:6002/search/instant?q=玩具&size=5"
  ```
  
  ---
  
  ### 获取单个文档
  
  - **端点**: `GET /search/{doc_id}`
  - **描述**: 根据文档 ID 获取单个商品详情,用于点击结果后的详情页或排查问题。
  
  #### 路径参数
  
  | 参数 | 类型 | 描述 |
  |------|------|------|
  | `doc_id` | string | 商品或文档 ID |
  
  #### 响应示例
  
  ```json
  {
    "id": "12345",
    "source": {
      "title": "芭比时尚娃娃",
      "min_price": 89.99,
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
582
      "category.keyword": "玩具"
4a677843   tangwang   文档完善
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
    }
  }
  ```
  
  #### 请求示例
  
  ```bash
  curl "http://localhost:6002/search/12345"
  ```
  
  ---
  
  ## 管理接口
  
  ### 健康检查
  
  - **端点**: `GET /admin/health`
  - **描述**: 检查服务与依赖(如 Elasticsearch)状态。
  
  ```json
  {
    "status": "healthy",
    "elasticsearch": "connected",
    "tenant_id": "tenant1"
  }
  ```
  
  ---
  
  ### 获取配置
  
  - **端点**: `GET /admin/config`
  - **描述**: 返回当前租户的脱敏配置,便于核对索引及排序表达式。
  
  ```json
  {
    "tenant_id": "tenant1",
    "tenant_name": "Tenant1 Test Instance",
    "es_index_name": "search_tenant1",
    "num_fields": 20,
    "num_indexes": 4,
    "supported_languages": ["zh", "en", "ru"],
    "ranking_expression": "bm25() + 0.2*text_embedding_relevance()",
    "spu_enabled": false
  }
  ```
  
  ---
  
  ### 索引统计
  
  - **端点**: `GET /admin/stats`
  - **描述**: 获取索引文档数量与磁盘大小,方便监控。
  
  ```json
  {
    "index_name": "search_tenant1",
    "document_count": 10000,
    "size_mb": 523.45
  }
  ```
  
  ---
  
  ## 数据模型
  
  ### 商品字段
  
  | 字段名 | 类型 | 描述 |
  |--------|------|------|
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
653
  | `spu_id` | keyword | SPU ID |
4a677843   tangwang   文档完善
654
655
656
657
  | `sku_id` | keyword/long | SKU ID(主键) |
  | `title` | text | 商品名称(中文) |
  | `en_title` | text | 商品名称(英文) |
  | `ru_title` | text | 商品名称(俄文) |
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
658
659
660
661
  | `category.keyword` | keyword | 类目(精确匹配) |
  | `vendor.keyword` | keyword | 品牌/供应商(精确匹配) |
  | `category` | HKText | 类目(支持 `category.keyword` 精确匹配) |
  | `tags.keyword` | keyword | 标签 |
4a677843   tangwang   文档完善
662
663
664
665
666
667
668
669
670
  | `min_price` | double | 最低价格 |
  | `max_price` | double | 最高价格 |
  | `compare_at_price` | double | 原价 |
  | `create_time` | date | 创建时间 |
  | `update_time` | date | 更新时间 |
  | `in_stock` | boolean | 是否有库存 |
  | `text_embedding` | dense_vector | 文本向量(1024 维) |
  | `image_embedding` | dense_vector | 图片向量(1024 维) |
  
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
671
  > 不同租户可自定义字段名称。推荐将可过滤的文本字段配置为 HKText,这样即可同时支持全文检索和 `field.keyword` 精确过滤;数值字段单独建索引以用于排序/Range。
4a677843   tangwang   文档完善
672
673
674
  
  ---
  
b73baf85   tangwang   撰写接口文档
675
676
677
678
  ## 附录
  
  ### 常用字段列表
  
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
679
  #### 过滤字段(使用 HKText 的 keyword 子字段)
b73baf85   tangwang   撰写接口文档
680
  
cadc77b6   tangwang   索引字段名、变量名、API数据结构...
681
682
683
  - `category.keyword`: 类目
  - `vendor.keyword`: 品牌/供应商
  - `tags.keyword`: 标签
b73baf85   tangwang   撰写接口文档
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
  
  #### 范围字段
  
  - `min_price`: 最低价格
  - `max_price`: 最高价格
  - `compare_at_price`: 原价
  - `create_time`: 创建时间
  - `update_time`: 更新时间
  
  #### 排序字段
  
  - `min_price`: 最低价格
  - `max_price`: 最高价格
  - `title`: 标题(字母序)
  - `create_time`: 创建时间
  - `update_time`: 更新时间
  - `relevance_score`: 相关性分数(默认)
  
4a677843   tangwang   文档完善
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
  ### 支持的分析器
  
  | 分析器 | 语言 | 描述 |
  |--------|------|------|
  | `chinese_ecommerce` | 中文 | 基于 Ansj 的电商优化中文分析器 |
  | `english` | 英文 | 标准英文分析器 |
  | `russian` | 俄文 | 俄文分析器 |
  | `arabic` | 阿拉伯文 | 阿拉伯文分析器 |
  | `spanish` | 西班牙文 | 西班牙文分析器 |
  | `japanese` | 日文 | 日文分析器 |
  
  ### 字段类型速查
  
  | 类型 | ES Mapping | 用途 |
  |------|------------|------|
  | `TEXT` | `text` | 全文检索 |
  | `KEYWORD` | `keyword` | 精确匹配、聚合、排序 |
  | `LONG` | `long` | 整数 |
  | `DOUBLE` | `double` | 浮点数 |
  | `DATE` | `date` | 日期时间 |
  | `BOOLEAN` | `boolean` | 布尔值 |
  | `TEXT_EMBEDDING` | `dense_vector` | 文本语义向量 |
  | `IMAGE_EMBEDDING` | `dense_vector` | 图片语义向量 |