Commit 9823d236277ee97942b642cbac1eb51b1d4c1a74
1 parent
ec44ff39
文档完善
Showing
1 changed file
with
34 additions
and
34 deletions
Show diff stats
docs/索引字段说明.md
| ... | ... | @@ -55,41 +55,28 @@ |
| 55 | 55 | { "type": "text", "analyzer": "russian" } |
| 56 | 56 | ``` |
| 57 | 57 | |
| 58 | -### 文本-多语言向量化 | |
| 58 | +### 关键词字段 | |
| 59 | 59 | |
| 60 | -- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景。 | |
| 60 | +- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写。 | |
| 61 | 61 | ```json |
| 62 | - { | |
| 63 | - "type": "dense_vector", | |
| 64 | - "dims": 1024, | |
| 65 | - "index": true, | |
| 66 | - "similarity": "dot_product" | |
| 67 | - } | |
| 62 | + { "type": "keyword" } | |
| 68 | 63 | ``` |
| 69 | 64 | |
| 70 | -### 图片-向量化 | |
| 65 | +### Hybrid Keyword+Text(HKText)字段 | |
| 71 | 66 | |
| 72 | -- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。 | |
| 67 | +- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。 | |
| 68 | +- 典型 mapping: | |
| 73 | 69 | ```json |
| 74 | 70 | { |
| 75 | - "type": "nested", | |
| 76 | - "properties": { | |
| 77 | - "vector": { | |
| 78 | - "type": "dense_vector", | |
| 79 | - "dims": 1024, | |
| 80 | - "similarity": "dot_product" | |
| 81 | - }, | |
| 82 | - "url": { "type": "text" } | |
| 71 | + "type": "text", | |
| 72 | + "analyzer": "factory_no_ngram_analyzer", | |
| 73 | + "search_analyzer": "factory_no_query_analyzer", | |
| 74 | + "fields": { | |
| 75 | + "keyword": { "type": "keyword", "normalizer": "lowercase" } | |
| 83 | 76 | } |
| 84 | 77 | } |
| 85 | 78 | ``` |
| 86 | - | |
| 87 | -### 关键词字段 | |
| 88 | - | |
| 89 | -- ES 输入支持字符串或字符串数组,统一写入 keyword 字段,默认大小写敏感,必要时可通过 normalizer 统一大小写。 | |
| 90 | - ```json | |
| 91 | - { "type": "keyword" } | |
| 92 | - ``` | |
| 79 | +- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。 | |
| 93 | 80 | |
| 94 | 81 | ### 数值字段 |
| 95 | 82 | |
| ... | ... | @@ -108,21 +95,34 @@ |
| 108 | 95 | ``` |
| 109 | 96 | - 查询:支持范围检索、排序与聚合。 |
| 110 | 97 | |
| 111 | -### Hybrid Keyword+Text(HKText)字段 | |
| 98 | +### 文本-多语言向量化 | |
| 112 | 99 | |
| 113 | -- 该类型用于“精确匹配优先 + 模糊匹配兜底”的业务场景(如品牌、标签、SEO 关键词)。 | |
| 114 | -- 典型 mapping: | |
| 100 | +- 调用“文本向量化”模块生成 1024 维向量,适用于标题、描述等语义检索场景。 | |
| 115 | 101 | ```json |
| 116 | 102 | { |
| 117 | - "type": "text", | |
| 118 | - "analyzer": "factory_no_ngram_analyzer", | |
| 119 | - "search_analyzer": "factory_no_query_analyzer", | |
| 120 | - "fields": { | |
| 121 | - "keyword": { "type": "keyword", "normalizer": "lowercase" } | |
| 103 | + "type": "dense_vector", | |
| 104 | + "dims": 1024, | |
| 105 | + "index": true, | |
| 106 | + "similarity": "dot_product" | |
| 107 | + } | |
| 108 | + ``` | |
| 109 | + | |
| 110 | +### 图片-向量化 | |
| 111 | + | |
| 112 | +- 调用“图片向量化”模块生成 1024 维向量,并保留图片 URL 以便回显。 | |
| 113 | + ```json | |
| 114 | + { | |
| 115 | + "type": "nested", | |
| 116 | + "properties": { | |
| 117 | + "vector": { | |
| 118 | + "type": "dense_vector", | |
| 119 | + "dims": 1024, | |
| 120 | + "similarity": "dot_product" | |
| 121 | + }, | |
| 122 | + "url": { "type": "text" } | |
| 122 | 123 | } |
| 123 | 124 | } |
| 124 | 125 | ``` |
| 125 | -- 业务命名:**HKText**。使用 `字段.keyword` 子字段满足过滤、聚合等精确需求,主字段支持 ngram 模糊搜索。 | |
| 126 | 126 | |
| 127 | 127 | ### 字段预处理与 ES 输入 |
| 128 | 128 | ... | ... |