25 Mar, 2026

1 commit

  • @config/dictionaries/style_intent_color.csv
    @config/dictionaries/style_intent_size.csv @query/style_intent.py
    @search/sku_intent_selector.py
    1. 两个csv词典,分为三列,
    - 英文关键词
    - 中文关键词
    - 标准属性名称词
    三列都可以允许逗号分割。补充的第三列使用在商品属性中,使用的是标准的英文名称
    2.
    判断意图的时候,中文词用中文翻译名去匹配,如果不存在中文翻译名,则用原始
    query,英文词同理
    3. SKU 选择的时候,用每一个 SKU 的属性名去匹配。
    匹配规则要大幅度简化,并做性能优化:
    1)文本匹配规则只需要看规范化后的属性值是否包含了词典配置的第三列"标准属性名称词",如果包含了,则认为匹配成功。
    找到第一个匹配成功的即可。如果都没有成功,后面也不再需要用向量匹配。
    暂时废弃向量匹配、双向匹配等复杂逻辑。
    tangwang
     

24 Mar, 2026

2 commits

  • 加了一个过滤/降权词典,query中有独立分词匹配到指定的触发词,将过滤带某些分词的商品(比如fitted/修身,过滤宽松、loose、relaxed、baggy,slouchy等商品)
    2. reranker的query使用翻译后的
    tangwang
     
  • tangwang
     

23 Mar, 2026

3 commits


22 Mar, 2026

2 commits


20 Mar, 2026

3 commits


19 Mar, 2026

2 commits