Commit 9823d236277ee97942b642cbac1eb51b1d4c1a74

Authored by tangwang
1 parent ec44ff39

文档完善

Showing 1 changed file with 34 additions and 34 deletions   Show diff stats
docs/索引字段说明.md
@@ -55,41 +55,28 @@ @@ -55,41 +55,28 @@
55 { "type": "text", "analyzer": "russian" } 55 { "type": "text", "analyzer": "russian" }
56 ``` 56 ```
57 57
58 -### 文本-多语言向量化 58 +### 关键词字段
59 59
60 -- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景 60 +- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写
61 ```json 61 ```json
62 - {  
63 - "type": "dense_vector",  
64 - "dims": 1024,  
65 - "index": true,  
66 - "similarity": "dot_product"  
67 - } 62 + { "type": "keyword" }
68 ``` 63 ```
69 64
70 -### 图片-向量化 65 +### Hybrid Keyword+Text(HKText)字段
71 66
72 -- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。 67 +- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。
  68 +- 典型 mapping:
73 ```json 69 ```json
74 { 70 {
75 - "type": "nested",  
76 - "properties": {  
77 - "vector": {  
78 - "type": "dense_vector",  
79 - "dims": 1024,  
80 - "similarity": "dot_product"  
81 - },  
82 - "url": { "type": "text" } 71 + "type": "text",
  72 + "analyzer": "factory_no_ngram_analyzer",
  73 + "search_analyzer": "factory_no_query_analyzer",
  74 + "fields": {
  75 + "keyword": { "type": "keyword", "normalizer": "lowercase" }
83 } 76 }
84 } 77 }
85 ``` 78 ```
86 -  
87 -### 关键词字段  
88 -  
89 -- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写。  
90 - ```json  
91 - { "type": "keyword" }  
92 - ``` 79 +- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。
93 80
94 ### 数值字段 81 ### 数值字段
95 82
@@ -108,21 +95,34 @@ @@ -108,21 +95,34 @@
108 ``` 95 ```
109 - 查询:支持范围检索、排序与聚合。 96 - 查询:支持范围检索、排序与聚合。
110 97
111 -### Hybrid Keyword+Text(HKText)字段 98 +### 文本-多语言向量化
112 99
113 -- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。  
114 -- 典型 mapping: 100 +- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景。
115 ```json 101 ```json
116 { 102 {
117 - "type": "text",  
118 - "analyzer": "factory_no_ngram_analyzer",  
119 - "search_analyzer": "factory_no_query_analyzer",  
120 - "fields": {  
121 - "keyword": { "type": "keyword", "normalizer": "lowercase" } 103 + "type": "dense_vector",
  104 + "dims": 1024,
  105 + "index": true,
  106 + "similarity": "dot_product"
  107 + }
  108 + ```
  109 +
  110 +### 图片-向量化
  111 +
  112 +- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。
  113 + ```json
  114 + {
  115 + "type": "nested",
  116 + "properties": {
  117 + "vector": {
  118 + "type": "dense_vector",
  119 + "dims": 1024,
  120 + "similarity": "dot_product"
  121 + },
  122 + "url": { "type": "text" }
122 } 123 }
123 } 124 }
124 ``` 125 ```
125 -- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。  
126 126
127 ### 字段预处理与 ES 输入 127 ### 字段预处理与 ES 输入
128 128