Commit 9c712e64eb48d00de17d7be37c3f88ca64121204

Authored by tangwang
1 parent 3438fe74

增加索引字段qanchors keywords

Showing 2 changed files with 32 additions and 0 deletions   Show diff stats
  1 +
1 # TODO 2 # TODO
2 多语言: 3 多语言:
3 语义: 4 语义:
4 5
  6 +
  7 +query anchor
  8 +我想给elasticsearch 增加字段 query anchor ,即哪些query点击到了这个doc,一个doc下面有多个query anchor,每个query anchor又有这两个属性:weight、dweight,分别代表 query在doc下的点击分布权重、doc在query下的点击分布权重。请问该如何设计这两个ES字段。
  9 +
  10 +需要有zh en两套query anchor,因为他们的解析器不一样。
  11 +
  12 +他的功能是辅助召回和排序。我搜索一个query,那么每个query跟 doc中的query anchor的相关性,也就是,除了将query到title 和keywords / brief等文本字段中搜索,也到 query anchor中搜索,从而辅助召回和相关性的计算。
  13 +
  14 +
  15 +
  16 +
5 # 电商搜索引擎 SaaS 17 # 电商搜索引擎 SaaS
6 18
7 一个针对跨境独立站(店匠 Shoplazza 等)的多租户可配置搜索平台。README 作为项目导航入口,帮助你在不同阶段定位到更详细的文档。 19 一个针对跨境独立站(店匠 Shoplazza 等)的多租户可配置搜索平台。README 作为项目导航入口,帮助你在不同阶段定位到更详细的文档。
mappings/search_products.json
@@ -50,6 +50,16 @@ @@ -50,6 +50,16 @@
50 "analyzer": "hanlp_index", 50 "analyzer": "hanlp_index",
51 "search_analyzer": "hanlp_standard" 51 "search_analyzer": "hanlp_standard"
52 }, 52 },
  53 + "qanchors_zh": {
  54 + "type": "text",
  55 + "analyzer": "hanlp_index",
  56 + "search_analyzer": "hanlp_standard"
  57 + },
  58 + "keywords_zh": {
  59 + "type": "text",
  60 + "analyzer": "hanlp_index",
  61 + "search_analyzer": "hanlp_standard"
  62 + },
53 "brief_zh": { 63 "brief_zh": {
54 "type": "text", 64 "type": "text",
55 "analyzer": "hanlp_index", 65 "analyzer": "hanlp_index",
@@ -76,6 +86,16 @@ @@ -76,6 +86,16 @@
76 "analyzer": "english", 86 "analyzer": "english",
77 "search_analyzer": "english" 87 "search_analyzer": "english"
78 }, 88 },
  89 + "qanchors_en": {
  90 + "type": "text",
  91 + "analyzer": "english",
  92 + "search_analyzer": "english"
  93 + },
  94 + "keywords_en": {
  95 + "type": "text",
  96 + "analyzer": "english",
  97 + "search_analyzer": "english"
  98 + },
79 "brief_en": { 99 "brief_en": {
80 "type": "text", 100 "type": "text",
81 "analyzer": "english", 101 "analyzer": "english",