Commit 9823d236277ee97942b642cbac1eb51b1d4c1a74

Authored by tangwang
1 parent ec44ff39

文档完善

Showing 1 changed file with 34 additions and 34 deletions   Show diff stats
docs/索引字段说明.md
... ... @@ -55,41 +55,28 @@
55 55 { "type": "text", "analyzer": "russian" }
56 56 ```
57 57  
58   -### 文本-多语言向量化
  58 +### 关键词字段
59 59  
60   -- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景
  60 +- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写
61 61 ```json
62   - {
63   - "type": "dense_vector",
64   - "dims": 1024,
65   - "index": true,
66   - "similarity": "dot_product"
67   - }
  62 + { "type": "keyword" }
68 63 ```
69 64  
70   -### 图片-向量化
  65 +### Hybrid Keyword+Text(HKText)字段
71 66  
72   -- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。
  67 +- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。
  68 +- 典型 mapping:
73 69 ```json
74 70 {
75   - "type": "nested",
76   - "properties": {
77   - "vector": {
78   - "type": "dense_vector",
79   - "dims": 1024,
80   - "similarity": "dot_product"
81   - },
82   - "url": { "type": "text" }
  71 + "type": "text",
  72 + "analyzer": "factory_no_ngram_analyzer",
  73 + "search_analyzer": "factory_no_query_analyzer",
  74 + "fields": {
  75 + "keyword": { "type": "keyword", "normalizer": "lowercase" }
83 76 }
84 77 }
85 78 ```
86   -
87   -### 关键词字段
88   -
89   -- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写。
90   - ```json
91   - { "type": "keyword" }
92   - ```
  79 +- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。
93 80  
94 81 ### 数值字段
95 82  
... ... @@ -108,21 +95,34 @@
108 95 ```
109 96 - 查询:支持范围检索、排序与聚合。
110 97  
111   -### Hybrid Keyword+Text(HKText)字段
  98 +### 文本-多语言向量化
112 99  
113   -- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。
114   -- 典型 mapping:
  100 +- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景。
115 101 ```json
116 102 {
117   - "type": "text",
118   - "analyzer": "factory_no_ngram_analyzer",
119   - "search_analyzer": "factory_no_query_analyzer",
120   - "fields": {
121   - "keyword": { "type": "keyword", "normalizer": "lowercase" }
  103 + "type": "dense_vector",
  104 + "dims": 1024,
  105 + "index": true,
  106 + "similarity": "dot_product"
  107 + }
  108 + ```
  109 +
  110 +### 图片-向量化
  111 +
  112 +- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。
  113 + ```json
  114 + {
  115 + "type": "nested",
  116 + "properties": {
  117 + "vector": {
  118 + "type": "dense_vector",
  119 + "dims": 1024,
  120 + "similarity": "dot_product"
  121 + },
  122 + "url": { "type": "text" }
122 123 }
123 124 }
124 125 ```
125   -- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。
126 126  
127 127 ### 字段预处理与 ES 输入
128 128  
... ...