ai-saas / saas-search

08 Apr, 2026

1 commit

1fdab52d This change adjusts the BM25 parameters used by the combined query. ... Browse Dir »

Previously, both `b` and `k1` were set to `0.0`. The original intention
was to avoid two common issues in e-commerce search relevance:

1. Over-penalizing longer product titles
   In product search, a shorter title should not automatically rank
higher just because BM25 favors shorter fields. For example, for a query
like “遥控车”, a product whose title is simply “遥控车” is not
necessarily a better candidate than a product with a slightly longer but
more descriptive title. In practice, extremely short titles may even
indicate lower-quality catalog data.

2. Over-rewarding repeated occurrences of the same term
   For longer queries such as “遥控喷雾翻滚多功能车玩具车”, the default
BM25 behavior may give too much weight to a term that appears multiple
times (for example “遥控”), even when other important query terms such
as “喷雾” or “翻滚” are missing. This can cause products with repeated
partial matches to outrank products that actually cover more of the user
intent.

Setting both parameters to zero was an intentional way to suppress
length normalization and term-frequency amplification. However, after
introducing a `combined_fields` query, this configuration becomes too
aggressive. Since `combined_fields` scores multiple fields as a unified
relevance signal, completely disabling both effects may also remove
useful ranking information, especially when we still want documents
matching more query terms across fields to be distinguishable from
weaker matches.

This update therefore relaxes the previous setting and reintroduces a
controlled amount of BM25 normalization/scoring behavior. The goal is to
keep the original intent — avoiding short-title bias and excessive
repeated-term gain — while allowing the combined query to better
preserve meaningful relevance differences across candidates.

Expected effect:
- reduce the bias toward unnaturally short product titles
- limit score inflation caused by repeated occurrences of the same term
- improve ranking stability for `combined_fields` queries
- better reward candidates that cover more of the overall query intent,
  instead of those that only repeat a subset of terms

2026-04-08 14:39:54 +0800

07 Apr, 2026

1 commit

483a05d9 文本搜索权重调整（qanchors enriched_tags enriched_attributes.value 调低） Browse Dir »

tangwang
2026-04-07 23:14:50 +0800

03 Apr, 2026

1 commit

ccbdf870 enriched_attributes.value字段参与搜索 Browse Dir »

tangwang
2026-04-03 21:11:50 +0800

02 Apr, 2026

1 commit

4d000c94 融合公式调参 Browse Dir »

tangwang
2026-04-02 12:14:41 +0800

01 Apr, 2026

4 commits

9df421ed 基于eval框架开始调参 Browse Dir »

tangwang
2026-04-01 20:05:22 +0800
310bb3bc eval tools Browse Dir »

tangwang
2026-04-01 15:59:19 +0800
331861d5 eval框架配置化 Browse Dir »

tangwang
2026-04-01 15:29:36 +0800
1c2ba48e eval tagger Browse Dir »

tangwang
2026-04-01 14:43:00 +0800

31 Mar, 2026

4 commits

881d338b 评估框架 Browse Dir »

tangwang
2026-03-31 18:25:19 +0800
432d1c88 评估框架 Browse Dir »

tangwang
2026-03-31 17:12:01 +0800
3b35f139 search evalution Browse Dir »

tangwang
2026-03-31 13:25:18 +0800
45b39796 qp性能优化 Browse Dir »

tangwang
2026-03-31 10:55:53 +0800

30 Mar, 2026

4 commits

418b6a4a 调参 Browse Dir »

tangwang
2026-03-30 22:33:10 +0800
de98daa3 多模态召回优化 Browse Dir »

tangwang
2026-03-30 20:59:37 +0800
9b956985 调试工具展示优化 Browse Dir »

tangwang
2026-03-30 19:35:43 +0800

c3425429 在以下文件中完成精排/融合清理工作：[search/rerank_client.py](/data/saas-search/search/rerank_clie… ... Browse Dir »

…nt.py)、[search/searcher.py](/data/saas-search/search/searcher.py)、[frontend/static/js/app.js](/data/saas-search/frontend/static/js/app.js)
以及
[tests/test_rerank_client.py](/data/saas-search/tests/test_rerank_client.py)。

主要修复内容如下：
- 精排现依据融合阶段得分进行排序，而非仅依据原始的 `fine_score`。
- 最终重排不再依赖独立的 `fine_scores`
  数组（该数组在精排排序后可能产生同步偏差），而是直接读取命中结果附带的
`_fine_score`。
-
精排与最终重排现均通过同一计算路径生成融合调试信息，该路径同时也决定实际排序结果，从而保证记录逻辑与生产逻辑保持一致。
-
调试信息载荷更加清晰：精排和最终重排阶段都会暴露融合输入/因子以及规范的
`fusion_summary`，前端界面现在会渲染该摘要信息。

主要问题：阶段逻辑重复且存在并行的数据通道：一个通道用于计算排序，另一个通道用于组装调试字段，还有第三个通道用于传递辅助数组。这造成了潜在的差异风险。本次重构通过将阶段得分作为唯一事实来源，并让调试/前端直接消费其输出而非事后重构，降低了该风险。

验证结果：
- `./.venv/bin/python -m pytest -q tests/test_rerank_client.py
  tests/test_search_rerank_window.py`
- `./.venv/bin/python -m py_compile search/rerank_client.py
  search/searcher.py`

结果：`22 passed`。

当前的主流程：

1. Query 解析
2. ES 召回
3. 粗排：只用 ES 内部文本/KNN 信号
4. 款式 SKU 选择 + title suffix
5. 精排：轻量 reranker + 文本/KNN 融合
6. 最终 rerank：重 reranker + fine score + 文本/KNN 融合
7. 分页、补全字段、格式化返回

主控代码在 [searcher.py](/data/saas-search/search/searcher.py)，打分与
rerank 细节在
[rerank_client.py](/data/saas-search/search/rerank_client.py)，配置定义在
[schema.py](/data/saas-search/config/schema.py) 和
[config.yaml](/data/saas-search/config/config.yaml)。

**先看入口怎么决定走哪条路**
在 [searcher.py:348](/data/saas-search/search/searcher.py#L348)
开始，`search()` 先读租户语言、开关、窗口大小。
关键判断在 [searcher.py:364](/data/saas-search/search/searcher.py#L364)
到 [searcher.py:372](/data/saas-search/search/searcher.py#L372)：

- `rerank_window` 现在是 80，见
  [config.yaml:256](/data/saas-search/config/config.yaml#L256)
- `coarse_rank.input_window` 是 700，`output_window` 是 240，见
  [config.yaml:231](/data/saas-search/config/config.yaml#L231)
- `fine_rank.input_window` 是 240，`output_window` 是 80，见
  [config.yaml:245](/data/saas-search/config/config.yaml#L245)

所以如果请求满足 `from_ + size <= rerank_window`，就进入完整漏斗：
- ES 实际取前 `700`
- 粗排后留 `240`
- 精排后留 `80`
- 最终 rerank 也只处理这 `80`
- 最后再做分页切片

如果请求页超出 80，就不走后面的多阶段漏斗，直接按 ES 原逻辑返回。

2026-03-30 12:16:05 +0800

27 Mar, 2026

8 commits

daa2690b 漏斗参数调优&呈现优化 Browse Dir »

tangwang
2026-03-27 23:00:16 +0800

8c8b9d84 ES 拉取 coarse_rank.input_window 条 -> 粗排按 text/knn 融合裁到 ... Browse Dir »

coarse_rank.output_window -> 再做 SKU 选择和 title suffix ->
精排调用轻量 reranker 裁到 fine_rank.output_window -> 最终重排调用现有
reranker，并在最终融合里加入 fine_score。同时把 reranker client/provider
改成了按 service_profile 选不同 service_url，这样 fine/final
可以共用同一套服务代码，只起不同实例。

2026-03-27 17:56:04 +0800

ceaf6d03 召回限定：must条件补充主干词命中逻辑。baseline的主干词提取方法。 ... Browse Dir »
```
TODO-keywords限定-done.txt
```
tangwang
2026-03-27 16:20:01 +0800
ed13851c 图片文本两个knn召回相关参数配置 Browse Dir »

tangwang
2026-03-27 11:58:00 +0800
1681a135 image_embeddin sizeg配置跟服务统一到768 Browse Dir »

tangwang
2026-03-27 11:26:54 +0800
6d71d8e0 多模态模型配置 Browse Dir »

tangwang
2026-03-27 08:58:47 +0800

24edc208 修改_extract_combined_knn_score相关的代码以及配置， ... Browse Dir »

重排融合：之前有knn的配置bias和exponential。现在，文本和图片的embedding相似需要融合，融合方式是dis_max，因此需要配置：
1）各自的权重和tie_breaker
2）整个向量方面的权重（bias和exponential）

2026-03-27 08:33:16 +0800

74116f05 jina-reranker-v3性能测试和参数优化 Browse Dir »

tangwang
2026-03-27 07:42:10 +0800

26 Mar, 2026

4 commits

971a0851 补充reranker-jina，探索listwize的优势 Browse Dir »

tangwang
2026-03-26 22:47:40 +0800
93be98cb 清理过时的文档 Browse Dir »

tangwang
2026-03-26 22:18:31 +0800
f86c5fee reranker性能参数脚本放在：tests/reranker_performance/ Browse Dir »

tangwang
2026-03-26 16:22:41 +0800
e38dc1be 融合公式参数调整、以及展示信息优化 Browse Dir »

tangwang
2026-03-26 11:28:04 +0800

25 Mar, 2026

11 commits

b0972ff9 qwen3_vllm_score attention TRITON_ATTN -> FLASHINFER ... Browse Dir »

（之前因为错误将attention方法该回到TRITON_ATTN，性能相比于之前的vllm版本更差。但是那个错误是能解决的。已修复保持FLASHINFER）

2026-03-25 22:59:43 +0800

540fb5af 添加了可关闭的开关：保留默认行为（避免 T4 上 FA2 ... Browse Dir »
```
报错），并允许通过配置或环境变量让 vLLM 自行选择 attention。 -- 临时版本
```
tangwang
2026-03-25 20:39:40 +0800

52ea6529 性能测试： ... Browse Dir »

这两个配置、四种情况：
backend:  qwen3_vllm | qwen3_vllm_score
instruction_format: compact | standard

调用 python scripts/benchmark_reranker_random_titles.py
100,200,400,600,800,1000 --repeat 5
产出性能测试报告

平均延迟（ms，客户端 POST /rerank 墙钟，--seed 99）
backend	instruction_format	n=100	n=200	n=400	n=600	n=800
n=1000
qwen3_vllm	compact	213.5	418.0	861.4	1263.4	1744.3	2162.2
qwen3_vllm	standard	254.9	475.4	909.7	1353.2	1912.5
2406.7
qwen3_vllm_score	compact	239.2	480.2	966.2	1433.5	1937.2
2428.4
qwen3_vllm_score	standard	299.6	591.8	1178.9	1773.7
2341.6	2931.7
归纳： 在本机 T4、当前 vLLM 与上述
YAML（max_model_len=160、infer_batch_size=100 等）下，两种后端都是
compact 快于 standard；整体最快为 qwen3_vllm + compact（n=1000 ≈
2.16 s），最慢为 qwen3_vllm_score + standard（≈ 2.93 s）。其他 GPU /
vLLM 版本下排序可能变化。

2026-03-25 19:15:56 +0800

749d78c8 支持 reranker精简instruction Browse Dir »

tangwang
2026-03-25 18:14:10 +0800
4823f463 qwen3_vllm_score + 独立 0.18 环境 Browse Dir »

tangwang
2026-03-25 17:24:00 +0800
9de5ef49 qwen3_vllm_score : task="score" +（原版 + hf_overrides）或 HuggingFace 上已转好的 seq-cls 模型。generate() Browse Dir »

tangwang
2026-03-25 16:11:12 +0800
5c21a485 qwen3-reranker-0.6b-gguf Browse Dir »

tangwang
2026-03-25 15:04:48 +0800
3d508beb reranker-4b-gguf Browse Dir »

tangwang
2026-03-25 12:23:14 +0800
87cacb1b 融合公式优化。加入意图匹配因子 Browse Dir »

tangwang
2026-03-25 10:58:56 +0800
837d5d76 sku筛选匹配规则优化，按 token/短语序列匹配，fixbadcase Browse Dir »

tangwang
2026-03-25 10:41:36 +0800

b712a831 意图识别策略和性能优化 ... Browse Dir »

@config/dictionaries/style_intent_color.csv
@config/dictionaries/style_intent_size.csv @query/style_intent.py
@search/sku_intent_selector.py
1. 两个csv词典，分为三列，
- 英文关键词
- 中文关键词
- 标准属性名称词
三列都可以允许逗号分割。补充的第三列使用在商品属性中，使用的是标准的英文名称
2.
判断意图的时候，中文词用中文翻译名去匹配，如果不存在中文翻译名，则用原始
query，英文词同理
3. SKU 选择的时候，用每一个 SKU 的属性名去匹配。
匹配规则要大幅度简化，并做性能优化：
1）文本匹配规则只需要看规范化后的属性值是否包含了词典配置的第三列"标准属性名称词"，如果包含了，则认为匹配成功。
找到第一个匹配成功的即可。如果都没有成功，后面也不再需要用向量匹配。
暂时废弃向量匹配、双向匹配等复杂逻辑。

2026-03-25 09:33:16 +0800

24 Mar, 2026

1 commit

74fdf9bd 1. ... Browse Dir »

加了一个过滤/降权词典，query中有独立分词匹配到指定的触发词，将过滤带某些分词的商品（比如fitted/修身，过滤宽松、loose、relaxed、baggy,slouchy等商品）
2. reranker的query使用翻译后的

2026-03-24 22:54:38 +0800