Commit b5ad4910a8db60b6b62d7b206bbc4cabfd992b96

Authored by tangwang
1 parent 062b97bc

文档完善

Showing 1 changed file with 5 additions and 1 deletions   Show diff stats
docs/索引字段说明.md
@@ -400,7 +400,7 @@ sku全部字段 @@ -400,7 +400,7 @@ sku全部字段
400 店匠的products接口返回的 title tags note category seo_title seo_description 等字段,为商家销售区域所使用语言,因此英文为主,各种语言都有。 400 店匠的products接口返回的 title tags note category seo_title seo_description 等字段,为商家销售区域所使用语言,因此英文为主,各种语言都有。
401 不同语言需要用不同的分析器,需要拆分不同的字段。 401 不同语言需要用不同的分析器,需要拆分不同的字段。
402 402
403 -考虑的方法是 403 +方案1
404 1. 索引层面: 404 1. 索引层面:
405 每种文本字段,都设置多份语言索引,暂时先包括 zh en 两种即可。 405 每种文本字段,都设置多份语言索引,暂时先包括 zh en 两种即可。
406 以下字段做两份,如果以后对接的商家达到8种语言,那么这些字段也对应的扩展到8份。 406 以下字段做两份,如果以后对接的商家达到8种语言,那么这些字段也对应的扩展到8份。
@@ -416,3 +416,7 @@ title brief description seo_title seo_description seo_keywords vendor vendor_key @@ -416,3 +416,7 @@ title brief description seo_title seo_description seo_keywords vendor vendor_key
416 3. 在线搜索时: 416 3. 在线搜索时:
417 多语言搜索作为效果优化的高级特性,比如某个用户配置了 zh, en 两种语言,那么 如索引的时候会进行不全,入两个字段。 417 多语言搜索作为效果优化的高级特性,比如某个用户配置了 zh, en 两种语言,那么 如索引的时候会进行不全,入两个字段。
418 搜索的时候 也准备 query_en query_zh 两个查询词 分别到多个字段搜索。 418 搜索的时候 也准备 query_en query_zh 两个查询词 分别到多个字段搜索。
  419 +
  420 +
  421 +方案2(不建议):
  422 +索引层面只要一套字段,分析器选择兼顾多种语言效果的(比如hanLP / english),两者对于中英文之外的其他语言的检索效果都会有折损。选择hanLP时 英文字段的检索质量会下降,选择English不能满足中文分词需求。