ai-saas / saas-search

30 Mar, 2026

11 commits

926e1e96 分词优化 Browse Code »

tangwang
2026-03-30 23:20:27 +0800
418b6a4a 调参 Browse Code »

tangwang
2026-03-30 22:33:10 +0800

must里面的两个combined_fields查询，boost分别设置为2和0.6，和其他查询条件一起，都放到should里面，设置minimum_should_match==1
2.
如果keywords_query跟combined_fields主查询的query一样，那么不需要再添加了

2026-03-30 21:49:36 +0800

db9c469c log optimize Browse Code »

tangwang
2026-03-30 21:31:04 +0800
de98daa3 多模态召回优化 Browse Code »

tangwang
2026-03-30 20:59:37 +0800
9b956985 调试工具展示优化 Browse Code »

tangwang
2026-03-30 19:35:43 +0800

6c35aff8 索引结构修改： ... Browse Code »

一、tags字段改支持多语言：
spu表tags字段，跟title走一样的翻译逻辑，填入原始语言、zh、en。

检查以下字段，都跟title一样走翻译逻辑
title
keywords
tags
brief
description
vendor
category_path
category_name_text

二、/indexer/enrich-content接口的修改
1.
请求参数，把language去掉，因为我返回的内容直接对应索引结构，不用你做处理了，因此不需要指定语言，降低耦合。
2. 返回 enriched_attributes enriched_tags
   qanchors三个字段，按原始内容填入。
3. enriched_tags是本次新增的，注意区别于tags字段。tags字段来源于mysql
   spu表，enriched_tags是本接口返回的。

三、specifications的value，需要翻译，也是需要填中英文：
{
  "specifications": [
    {
      "sku_id": "sku-red-s",
      "name": "color",
      "value_keyword": "красный",
      "value_text": {
        "zh": "红色",
        "en": "red"
      }
    }
  ]
}

2026-03-30 19:12:26 +0800

d350861f 索引结构修改 Browse Code »

tangwang
2026-03-30 18:59:50 +0800
fca871fb 索引字段修改 Browse Code »

tangwang
2026-03-30 17:25:33 +0800
36cf0ef9 es索引结果修改 Browse Code »

tangwang
2026-03-30 16:20:24 +0800

c3425429 在以下文件中完成精排/融合清理工作：[search/rerank_client.py](/data/saas-search/search/rerank_clie… ... Browse Code »

…nt.py)、[search/searcher.py](/data/saas-search/search/searcher.py)、[frontend/static/js/app.js](/data/saas-search/frontend/static/js/app.js)
以及
[tests/test_rerank_client.py](/data/saas-search/tests/test_rerank_client.py)。

主要修复内容如下：
- 精排现依据融合阶段得分进行排序，而非仅依据原始的 `fine_score`。
- 最终重排不再依赖独立的 `fine_scores`
  数组（该数组在精排排序后可能产生同步偏差），而是直接读取命中结果附带的
`_fine_score`。
-
精排与最终重排现均通过同一计算路径生成融合调试信息，该路径同时也决定实际排序结果，从而保证记录逻辑与生产逻辑保持一致。
-
调试信息载荷更加清晰：精排和最终重排阶段都会暴露融合输入/因子以及规范的
`fusion_summary`，前端界面现在会渲染该摘要信息。

主要问题：阶段逻辑重复且存在并行的数据通道：一个通道用于计算排序，另一个通道用于组装调试字段，还有第三个通道用于传递辅助数组。这造成了潜在的差异风险。本次重构通过将阶段得分作为唯一事实来源，并让调试/前端直接消费其输出而非事后重构，降低了该风险。

验证结果：
- `./.venv/bin/python -m pytest -q tests/test_rerank_client.py
  tests/test_search_rerank_window.py`
- `./.venv/bin/python -m py_compile search/rerank_client.py
  search/searcher.py`

结果：`22 passed`。

当前的主流程：

1. Query 解析
2. ES 召回
3. 粗排：只用 ES 内部文本/KNN 信号
4. 款式 SKU 选择 + title suffix
5. 精排：轻量 reranker + 文本/KNN 融合
6. 最终 rerank：重 reranker + fine score + 文本/KNN 融合
7. 分页、补全字段、格式化返回

主控代码在 [searcher.py](/data/saas-search/search/searcher.py)，打分与
rerank 细节在
[rerank_client.py](/data/saas-search/search/rerank_client.py)，配置定义在
[schema.py](/data/saas-search/config/schema.py) 和
[config.yaml](/data/saas-search/config/config.yaml)。

**先看入口怎么决定走哪条路**
在 [searcher.py:348](/data/saas-search/search/searcher.py#L348)
开始，`search()` 先读租户语言、开关、窗口大小。
关键判断在 [searcher.py:364](/data/saas-search/search/searcher.py#L364)
到 [searcher.py:372](/data/saas-search/search/searcher.py#L372)：

- `rerank_window` 现在是 80，见
  [config.yaml:256](/data/saas-search/config/config.yaml#L256)
- `coarse_rank.input_window` 是 700，`output_window` 是 240，见
  [config.yaml:231](/data/saas-search/config/config.yaml#L231)
- `fine_rank.input_window` 是 240，`output_window` 是 80，见
  [config.yaml:245](/data/saas-search/config/config.yaml#L245)

所以如果请求满足 `from_ + size <= rerank_window`，就进入完整漏斗：
- ES 实际取前 `700`
- 粗排后留 `240`
- 精排后留 `80`
- 最终 rerank 也只处理这 `80`
- 最后再做分页切片

如果请求页超出 80，就不走后面的多阶段漏斗，直接按 ES 原逻辑返回。

2026-03-30 12:16:05 +0800

27 Mar, 2026

11 commits

daa2690b 漏斗参数调优&呈现优化 Browse Code »

tangwang
2026-03-27 23:00:16 +0800
16d28bf8 漏斗信息呈现，便于调整参数 Browse Code »

tangwang
2026-03-27 19:59:09 +0800

8c8b9d84 ES 拉取 coarse_rank.input_window 条 -> 粗排按 text/knn 融合裁到 ... Browse Code »

coarse_rank.output_window -> 再做 SKU 选择和 title suffix ->
精排调用轻量 reranker 裁到 fine_rank.output_window -> 最终重排调用现有
reranker，并在最终融合里加入 fine_score。同时把 reranker client/provider
改成了按 service_profile 选不同 service_url，这样 fine/final
可以共用同一套服务代码，只起不同实例。

2026-03-27 17:56:04 +0800

ceaf6d03 召回限定：must条件补充主干词命中逻辑。baseline的主干词提取方法。 ... Browse Code »
```
TODO-keywords限定-done.txt
```
tangwang
2026-03-27 16:20:01 +0800
ed13851c 图片文本两个knn召回相关参数配置 Browse Code »

tangwang
2026-03-27 11:58:00 +0800
1681a135 image_embeddin sizeg配置跟服务统一到768 Browse Code »

tangwang
2026-03-27 11:26:54 +0800
5a01af3c 多模态hashkey调整：1. 加入model_name,2.text/url转hash Browse Code »

tangwang
2026-03-27 10:36:59 +0800
6d71d8e0 多模态模型配置 Browse Code »

tangwang
2026-03-27 08:58:47 +0800

24edc208 修改_extract_combined_knn_score相关的代码以及配置， ... Browse Code »

重排融合：之前有knn的配置bias和exponential。现在，文本和图片的embedding相似需要融合，融合方式是dis_max，因此需要配置：
1）各自的权重和tie_breaker
2）整个向量方面的权重（bias和exponential）

2026-03-27 08:33:16 +0800

dc403578 多模态搜索 Browse Code »

tangwang
2026-03-27 08:11:35 +0800
74116f05 jina-reranker-v3性能测试和参数优化 Browse Code »

tangwang
2026-03-27 07:42:10 +0800

26 Mar, 2026

6 commits

971a0851 补充reranker-jina，探索listwize的优势 Browse Code »

tangwang
2026-03-26 22:47:40 +0800
93be98cb 清理过时的文档 Browse Code »

tangwang
2026-03-26 22:18:31 +0800
7a013ca7 多模态文本向量服务ok Browse Code »

tangwang
2026-03-26 20:46:24 +0800
d47889b9 ES 字段查询工具 scripts/es_debug_search.py Browse Code »

tangwang
2026-03-26 19:46:37 +0800
f86c5fee reranker性能参数脚本放在：tests/reranker_performance/ Browse Code »

tangwang
2026-03-26 16:22:41 +0800
e38dc1be 融合公式参数调整、以及展示信息优化 Browse Code »

tangwang
2026-03-26 11:28:04 +0800

25 Mar, 2026

11 commits

b0972ff9 qwen3_vllm_score attention TRITON_ATTN -> FLASHINFER ... Browse Code »

（之前因为错误将attention方法该回到TRITON_ATTN，性能相比于之前的vllm版本更差。但是那个错误是能解决的。已修复保持FLASHINFER）

2026-03-25 22:59:43 +0800

540fb5af 添加了可关闭的开关：保留默认行为（避免 T4 上 FA2 ... Browse Code »
```
报错），并允许通过配置或环境变量让 vLLM 自行选择 attention。 -- 临时版本
```
tangwang
2026-03-25 20:39:40 +0800

52ea6529 性能测试： ... Browse Code »

这两个配置、四种情况：
backend:  qwen3_vllm | qwen3_vllm_score
instruction_format: compact | standard

调用 python scripts/benchmark_reranker_random_titles.py
100,200,400,600,800,1000 --repeat 5
产出性能测试报告

平均延迟（ms，客户端 POST /rerank 墙钟，--seed 99）
backend	instruction_format	n=100	n=200	n=400	n=600	n=800
n=1000
qwen3_vllm	compact	213.5	418.0	861.4	1263.4	1744.3	2162.2
qwen3_vllm	standard	254.9	475.4	909.7	1353.2	1912.5
2406.7
qwen3_vllm_score	compact	239.2	480.2	966.2	1433.5	1937.2
2428.4
qwen3_vllm_score	standard	299.6	591.8	1178.9	1773.7
2341.6	2931.7
归纳： 在本机 T4、当前 vLLM 与上述
YAML（max_model_len=160、infer_batch_size=100 等）下，两种后端都是
compact 快于 standard；整体最快为 qwen3_vllm + compact（n=1000 ≈
2.16 s），最慢为 qwen3_vllm_score + standard（≈ 2.93 s）。其他 GPU /
vLLM 版本下排序可能变化。

2026-03-25 19:15:56 +0800

749d78c8 支持 reranker精简instruction Browse Code »

tangwang
2026-03-25 18:14:10 +0800
4823f463 qwen3_vllm_score + 独立 0.18 环境 Browse Code »

tangwang
2026-03-25 17:24:00 +0800
9de5ef49 qwen3_vllm_score : task="score" +（原版 + hf_overrides）或 HuggingFace 上已转好的 seq-cls 模型。generate() Browse Code »

tangwang
2026-03-25 16:11:12 +0800
5c21a485 qwen3-reranker-0.6b-gguf Browse Code »

tangwang
2026-03-25 15:04:48 +0800
3d508beb reranker-4b-gguf Browse Code »

tangwang
2026-03-25 12:23:14 +0800
87cacb1b 融合公式优化。加入意图匹配因子 Browse Code »

tangwang
2026-03-25 10:58:56 +0800
837d5d76 sku筛选匹配规则优化，按 token/短语序列匹配，fixbadcase Browse Code »

tangwang
2026-03-25 10:41:36 +0800

b712a831 意图识别策略和性能优化 ... Browse Code »

@config/dictionaries/style_intent_color.csv
@config/dictionaries/style_intent_size.csv @query/style_intent.py
@search/sku_intent_selector.py
1. 两个csv词典，分为三列，
- 英文关键词
- 中文关键词
- 标准属性名称词
三列都可以允许逗号分割。补充的第三列使用在商品属性中，使用的是标准的英文名称
2.
判断意图的时候，中文词用中文翻译名去匹配，如果不存在中文翻译名，则用原始
query，英文词同理
3. SKU 选择的时候，用每一个 SKU 的属性名去匹配。
匹配规则要大幅度简化，并做性能优化：
1）文本匹配规则只需要看规范化后的属性值是否包含了词典配置的第三列"标准属性名称词"，如果包含了，则认为匹配成功。
找到第一个匹配成功的即可。如果都没有成功，后面也不再需要用向量匹配。
暂时废弃向量匹配、双向匹配等复杂逻辑。

2026-03-25 09:33:16 +0800

24 Mar, 2026

1 commit

74fdf9bd 1. ... Browse Code »

加了一个过滤/降权词典，query中有独立分词匹配到指定的触发词，将过滤带某些分词的商品（比如fitted/修身，过滤宽松、loose、relaxed、baggy,slouchy等商品）
2. reranker的query使用翻译后的

2026-03-24 22:54:38 +0800