20 Apr, 2026

1 commit

  • ## 主要能力
    - 在 rerank 窗口内对 hits 做 SKU 预决策:款式意图(多源同义词)+ 图像 KNN inner_hits URL 对齐 SKU.image_src,统一一次决策、无级联 fallback。
    - 区分文本证据强度:final_source ∈ {option, taxonomy, image, none};matched_sources 按意图记录 option 或 taxonomy;selected_text / rerank_suffix 回填真实命中片段(SKU option 原文或 taxonomy value 原文)。
    - 权威规则:SKU 在已解析维度上有非空 option 值时仅以该值参与匹配;SPU 级 enriched_taxonomy_attributes 不覆盖与之一致的 SKU 级矛盾值(修复「taxonomy 把白色 SKU 当卡其色命中」)。
    - 图像:nested image KNN / exact rescore 增加 inner_hits(url),用于 SKU 置顶时的视觉 tie-break(仅在文本命中集内)或无意图时纯图像置顶。
    - 查询侧:DetectedStyleIntent 增加 all_terms(zh+en+attribute 并集),属性值匹配与意图词表一致。
    - API:SpuResult 透出 enriched_attributes / enriched_taxonomy_attributes(避免 Pydantic 丢弃 ES 字段)。
    
    ## 属性值匹配(括号和分隔符)
    - 在分词前对归一化后的 option/taxonomy 字符串执行 _with_segment_boundaries_for_matching:将全/半角括号、斜杠、顿号、中英文标点、中点、各类横线等替换为空格,再 simple_tokenize + 滑窗;无分隔的连续汉字仍走纯中文子串回退(如 卡其色棉)。
    - 参数化测试覆盖多种括号与常见电商分隔写法。
    
    ## 编排与配置
    - searcher:_should_run_sku_selection = 款式意图激活 或 存在 image_query_vector;prefetch _source 含 skus、option 名、enriched_taxonomy_attributes。
    - es_query_builder:image knn / exact image rescore 的 nested 子句带 inner_hits。
    
    ## 测试与仓库
    - tests/test_sku_intent_selector.py、tests/test_search_rerank_window.py 更新;移除已废弃的 embedding-fallback 集成断言。
    - .gitignore:忽略 artifacts/search_evaluation/datasets/(本地评估大数据集,避免误提交)。
    
    Made-with: Cursor
    tangwang
     

31 Mar, 2026

1 commit


21 Mar, 2026

1 commit


17 Mar, 2026

1 commit


09 Mar, 2026

2 commits


06 Mar, 2026

1 commit


22 Dec, 2025

1 commit


09 Dec, 2025

1 commit


18 Nov, 2025

1 commit



08 Nov, 2025

1 commit