diff --git a/docs/索引字段说明.md b/docs/索引字段说明.md index a8bc0f4..11f9899 100644 --- a/docs/索引字段说明.md +++ b/docs/索引字段说明.md @@ -400,7 +400,7 @@ sku全部字段 店匠的products接口返回的 title tags note category seo_title seo_description 等字段,为商家销售区域所使用语言,因此英文为主,各种语言都有。 不同语言需要用不同的分析器,需要拆分不同的字段。 -考虑的方法是: +方案1: 1. 索引层面: 每种文本字段,都设置多份语言索引,暂时先包括 zh en 两种即可。 以下字段做两份,如果以后对接的商家达到8种语言,那么这些字段也对应的扩展到8份。 @@ -416,3 +416,7 @@ title brief description seo_title seo_description seo_keywords vendor vendor_key 3. 在线搜索时: 多语言搜索作为效果优化的高级特性,比如某个用户配置了 zh, en 两种语言,那么 如索引的时候会进行不全,入两个字段。 搜索的时候 也准备 query_en query_zh 两个查询词 分别到多个字段搜索。 + + +方案2(不建议): +索引层面只要一套字段,分析器选择兼顾多种语言效果的(比如hanLP / english),两者对于中英文之外的其他语言的检索效果都会有折损。选择hanLP时 英文字段的检索质量会下降,选择English不能满足中文分词需求。 -- libgit2 0.21.2