Commit b5ad4910a8db60b6b62d7b206bbc4cabfd992b96
1 parent
062b97bc
文档完善
Showing
1 changed file
with
5 additions
and
1 deletions
Show diff stats
docs/索引字段说明.md
| ... | ... | @@ -400,7 +400,7 @@ sku全部字段 |
| 400 | 400 | 店匠的products接口返回的 title tags note category seo_title seo_description 等字段,为商家销售区域所使用语言,因此英文为主,各种语言都有。 |
| 401 | 401 | 不同语言需要用不同的分析器,需要拆分不同的字段。 |
| 402 | 402 | |
| 403 | -考虑的方法是: | |
| 403 | +方案1: | |
| 404 | 404 | 1. 索引层面: |
| 405 | 405 | 每种文本字段,都设置多份语言索引,暂时先包括 zh en 两种即可。 |
| 406 | 406 | 以下字段做两份,如果以后对接的商家达到8种语言,那么这些字段也对应的扩展到8份。 |
| ... | ... | @@ -416,3 +416,7 @@ title brief description seo_title seo_description seo_keywords vendor vendor_key |
| 416 | 416 | 3. 在线搜索时: |
| 417 | 417 | 多语言搜索作为效果优化的高级特性,比如某个用户配置了 zh, en 两种语言,那么 如索引的时候会进行不全,入两个字段。 |
| 418 | 418 | 搜索的时候 也准备 query_en query_zh 两个查询词 分别到多个字段搜索。 |
| 419 | + | |
| 420 | + | |
| 421 | +方案2(不建议): | |
| 422 | +索引层面只要一套字段,分析器选择兼顾多种语言效果的(比如hanLP / english),两者对于中英文之外的其他语言的检索效果都会有折损。选择hanLP时 英文字段的检索质量会下降,选择English不能满足中文分词需求。 | ... | ... |