diff --git a/docs/索引字段说明.md b/docs/索引字段说明.md index 131d90a..dfd2134 100644 --- a/docs/索引字段说明.md +++ b/docs/索引字段说明.md @@ -55,41 +55,28 @@ { "type": "text", "analyzer": "russian" } ``` -### 文本-多语言向量化 +### 关键词字段 -- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景。 +- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写。 ```json - { - "type": "dense_vector", - "dims": 1024, - "index": true, - "similarity": "dot_product" - } + { "type": "keyword" } ``` -### 图片-向量化 +### Hybrid Keyword+Text(HKText)字段 -- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。 +- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。 +- 典型 mapping: ```json { - "type": "nested", - "properties": { - "vector": { - "type": "dense_vector", - "dims": 1024, - "similarity": "dot_product" - }, - "url": { "type": "text" } + "type": "text", + "analyzer": "factory_no_ngram_analyzer", + "search_analyzer": "factory_no_query_analyzer", + "fields": { + "keyword": { "type": "keyword", "normalizer": "lowercase" } } } ``` - -### 关键词字段 - -- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写。 - ```json - { "type": "keyword" } - ``` +- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。 ### 数值字段 @@ -108,21 +95,34 @@ ``` - 查询:支持范围检索、排序与聚合。 -### Hybrid Keyword+Text(HKText)字段 +### 文本-多语言向量化 -- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。 -- 典型 mapping: +- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景。 ```json { - "type": "text", - "analyzer": "factory_no_ngram_analyzer", - "search_analyzer": "factory_no_query_analyzer", - "fields": { - "keyword": { "type": "keyword", "normalizer": "lowercase" } + "type": "dense_vector", + "dims": 1024, + "index": true, + "similarity": "dot_product" + } + ``` + +### 图片-向量化 + +- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。 + ```json + { + "type": "nested", + "properties": { + "vector": { + "type": "dense_vector", + "dims": 1024, + "similarity": "dot_product" + }, + "url": { "type": "text" } } } ``` -- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。 ### 字段预处理与 ES 输入 -- libgit2 0.21.2