ai-saas / saas-search

11 Apr, 2026

1 commit

a3275468 已把本仓库里的 `/indexer/enrich-content` 本地实现清理掉了，并把 indexer 主链路里对这套实现的隐式依赖一起摘掉。 ... Browse Dir »

这次代码侧的核心变化是：
- 删除了 `indexer/product_enrich.py`、`indexer/product_enrich_prompts.py` 及相关单测。
- 在 [api/routes/indexer.py](/data/saas-search/api/routes/indexer.py:55) 移除了 `/indexer/enrich-content` 路由；现在这个路径在本仓库 indexer 服务里会是 `404`，对应契约测试也已改成校验移除状态：[tests/ci/test_service_api_contracts.py](/data/saas-search/tests/ci/test_service_api_contracts.py:345)。
- 在 [api/routes/indexer.py](/data/saas-search/api/routes/indexer.py:183)、[indexer/document_transformer.py](/data/saas-search/indexer/document_transformer.py:109)、[indexer/incremental_service.py](/data/saas-search/indexer/incremental_service.py:587)、[indexer/spu_transformer.py](/data/saas-search/indexer/spu_transformer.py:223) 去掉了构建 doc 时自动补 `qanchors` / `enriched_*` 的本地 LLM 富化逻辑。现在 `build-docs` / `reindex` / `index` 只负责基础文档构建。
- 在 [config/schema.py](/data/saas-search/config/schema.py:316)、[config/loader.py](/data/saas-search/config/loader.py:824)、[config/env_config.py](/data/saas-search/config/env_config.py:37)、[config/config.yaml](/data/saas-search/config/config.yaml:32) 清掉了旧实现专用的 `product_enrich` 和 anchor cache 配置面。

重要文档也一起同步了，重点是把“能力已迁出、本仓库不再内置生成”写明确：
- [README.md](/data/saas-search/README.md:113)
- [docs/搜索API对接指南-00-总览与快速开始.md](</data/saas-search/docs/搜索API对接指南-00-总览与快速开始.md:108>)
- [docs/搜索API对接指南-05-索引接口（Indexer）.md](</data/saas-search/docs/搜索API对接指南-05-索引接口（Indexer）.md:647>)
- [docs/搜索API对接指南-07-微服务接口（Embedding-Reranker-Translation）.md](</data/saas-search/docs/搜索API对接指南-07-微服务接口（Embedding-Reranker-Translation）.md:441>)
- [docs/工作总结-微服务性能优化与架构.md](</data/saas-search/docs/工作总结-微服务性能优化与架构.md:96>)
- [docs/缓存与Redis使用说明.md](</data/saas-search/docs/缓存与Redis使用说明.md:186>)
- [indexer/README.md](/data/saas-search/indexer/README.md:508)
- [indexer/ANCHORS_AND_SEMANTIC_ATTRIBUTES.md](/data/saas-search/indexer/ANCHORS_AND_SEMANTIC_ATTRIBUTES.md:1)

验证做了两步：
- `python3 -m compileall ...` 通过
- `source activate.sh && python -m pytest tests/ci/test_service_api_contracts.py -q` 通过，`31 passed`

剩下我认为仍有“旧信息”但暂时没动的，主要是历史记录类文档，不算当前对接口径：
- [docs/issues/issue.md](/data/saas-search/docs/issues/issue.md:295)
- [docs/issues/issue.txt](/data/saas-search/docs/issues/issue.txt:468)
- [docs/issues/issue-2026-03-29-索引修改-done-0330.md](</data/saas-search/docs/issues/issue-2026-03-29-索引修改-done-0330.md:23>)
- [docs/issues/issue-2026-04-04-增加多模态标注-TODO.md](</data/saas-search/docs/issues/issue-2026-04-04-增加多模态标注-TODO.md:1>)

另外，工作区里原本就有 `.env` 修改和未跟踪的 `AGENTS.md`，我没有动它们。

2026-04-11 22:03:00 +0800

09 Apr, 2026

2 commits

32e9b30c scripts/ 根目录主要保留启动/编排入口，其他脚本归到了几个固定子目录： ... Browse Dir »

  - 数据转换放到 scripts/data_import/README.md
  - 诊断巡检放到 scripts/inspect/README.md
  - 运维辅助放到 scripts/ops/README.md
  - 前端辅助服务放到 scripts/frontend/frontend_server.py
  - 翻译模型下载放到 scripts/translation/download_translation_models.py
  - 临时图片补 embedding 脚本收敛成
    scripts/maintenance/embed_tenant_image_urls.py
  - Redis 监控脚本并入 redis/，现在是 scripts/redis/monitor_eviction.py

  同时我把真实调用链都改到了新位置：

  - scripts/start_frontend.sh
  - scripts/start_cnclip_service.sh
  - scripts/service_ctl.sh
  - scripts/setup_translator_venv.sh
  - scripts/README.md

  文档里涉及这些脚本的路径也同步修了，主要是 docs/QUICKSTART.md 和
translation/README.md。

2026-04-09 23:48:39 +0800

3abbc95a 重构(scripts): 整理scripts目录，按现架构分类并迁移性能/手动测试脚本 ... Browse Dir »

问题背景：
- scripts/
  目录下混有服务启动、数据转换、性能压测、临时脚本及历史备份目录
- 存在大量中间迭代遗留信息，不利于维护和新人理解
- 现行服务编排已稳定为 service_ctl up all 的集合：tei / cnclip /
  embedding / embedding-image / translator / reranker / backend /
indexer / frontend / eval-web，不再保留 reranker-fine 默认位

调整内容：
1. 根 scripts/ 收敛为运行、运维、环境、数据处理脚本，并新增
   scripts/README.md 说明文档
2. 性能/压测/调参脚本整体迁至 benchmarks/ 目录，同步更新
   benchmarks/README.md
3. 人工试跑脚本迁至 tests/manual/ 目录，同步更新 tests/manual/README.md
4. 删除明确过时内容：
   - scripts/indexer__old_2025_11/
   - scripts/start.sh
   - scripts/install_server_deps.sh
5. 同步修正以下文档中的路径及过时描述：
   - 根目录 README.md
   - 性能报告相关文档
   - reranker/translation 模块文档

技术细节：
- 性能测试不放常规 tests/
  的原因：这类脚本依赖真实服务、GPU、模型和环境噪声，不适合作为稳定回归门禁；benchmarks/
更贴合其定位
- tests/manual/ 仅存放需要人工启动依赖、手工观察结果的接口试跑脚本
- 所有迁移后的 Python 脚本已通过 py_compile 语法校验
- 所有迁移后的 Shell 脚本已通过 bash -n 语法校验

校验结果：
- py_compile: 通过
- bash -n: 通过

2026-04-09 23:36:06 +0800

08 Apr, 2026

2 commits

8e081187 ERR打分，停止概率的计算公式修改为通用方法： p(t) = (2^t - 1) / 2^{max_grade} Browse Dir »

tangwang
2026-04-08 15:50:55 +0800
d73ca84a refine eval case snapshots and rename relevance levels Browse Dir »

tangwang
2026-04-08 15:39:47 +0800

07 Apr, 2026

3 commits

6e3e6770 suggest文档维护 Browse Dir »

tangwang
2026-04-07 22:14:59 +0800

9f33fe3c fix suggestion rebuild flow and es index creation ... Browse Dir »

- consolidate suggestion rebuild flow into build_suggestions.sh via --rebuild and remove the redundant rebuild_suggestions.sh wrapper
- make suggestion versioned index names use microseconds and handle index-create retries/timeouts without false already_exists failures
- treat create requests as successful when the index was created server-side, then explicitly wait for shard readiness and surface allocation diagnostics
- clean up freshly created suggestion indices on rebuild failure to avoid leaving red orphan indices behind
- make rebuild smoke tests target the local backend by default, with SUGGESTIONS_SMOKE_BASE_URL as the explicit override
- add unit coverage for microsecond versioned index names and cleanup on unallocatable index failures

2026-04-07 12:43:04 +0800

e50924ed 1. tags -> enriched_tags ... Browse Dir »
```
2. issues文档
```
tangwang
2026-04-07 11:45:15 +0800

04 Apr, 2026

2 commits

441f049d 评测体系优化，以及 ... Browse Dir »
```
Exact Match
High Relevant
Low Relevant
Irrelevant

to

Fully Relevant
Mostly Relevant
Weakly Relevant
Irrelevant
```
tangwang
2026-04-04 22:14:42 +0800
f5da42e6 标注提示词优化 Browse Dir »

tangwang
2026-04-04 19:02:43 +0800

03 Apr, 2026

1 commit

ccbdf870 enriched_attributes.value字段参与搜索 Browse Dir »

tangwang
2026-04-03 21:11:50 +0800

02 Apr, 2026

4 commits

41345271 文档更新 Browse Dir »

tangwang
2026-04-02 19:46:27 +0800

465f90e1 添加LTR数据收集 ... Browse Dir »

目前在54训练数据里面，拆分44条train + 10
test，训练集显著提升但是test上不及基线
作为基础设施保留，以后可以考虑扩大数据集进行使用

2026-04-02 16:20:45 +0800

a6d51aa7 eval Browse Dir »

tangwang
2026-04-02 13:56:45 +0800
4d000c94 融合公式调参 Browse Dir »

tangwang
2026-04-02 12:14:41 +0800

01 Apr, 2026

16 commits

30b490e1 添加ERR评估指标 Browse Dir »

tangwang
2026-04-01 22:18:40 +0800
7ddd4cb3 评估体系从三等级->四等级 Exact Match / High Relevant / Low Relevant / ... Browse Dir »
```
Irrelevant
```
tangwang
2026-04-01 21:35:57 +0800
9df421ed 基于eval框架开始调参 Browse Dir »

tangwang
2026-04-01 20:05:22 +0800
42024409 评估框架-批量打标 Browse Dir »

tangwang
2026-04-01 16:57:58 +0800
286e9b4f evalution Browse Dir »

tangwang
2026-04-01 16:10:30 +0800
310bb3bc eval tools Browse Dir »

tangwang
2026-04-01 15:59:19 +0800
331861d5 eval框架配置化 Browse Dir »

tangwang
2026-04-01 15:29:36 +0800
1c2ba48e eval tagger Browse Dir »

tangwang
2026-04-01 14:43:00 +0800

cdd8ee3a eval框架日志独立 ... Browse Dir »

现在的行为（按你的路径）
用途	路径（相对仓库根 PROJECT_ROOT）
评估主日志（CLI + framework 的 INFO）	logs/eval.log
LLM 全量 prompt / 原始响应	logs/verbose/eval_verbose.log
实现要点：

constants.py：EVAL_LOG_DIR、EVAL_VERBOSE_LOG_DIR、EVAL_LOG_FILE、EVAL_VERBOSE_LOG_FILE。
logging_setup.py：setup_eval_logging() 给名为 search_eval 的 logger 挂
文件 + stderr，只初始化一次；build_annotation_set.py / serve_eval_web.py
走的 eval_framework.cli.main() 开头会先调用。
cli.py：原来的 print 改为 search_eval.cli 的 logging.info；启动时写一条
CLI start command=... log_file=... 到 logs/eval.log。
framework.py：rebuild 相关 print 改为 search_eval.framework 的
logging.info。
clients.py：verbose 改为写入
logs/verbose/eval_verbose.log；首次需要时调用 setup_eval_logging()，并用
search_eval.info 提示 verbose 文件路径（不再用 print）。

2026-04-01 14:19:27 +0800

35ae3b29 批量评估框架，召回参数修改和llm评估终止条件优化 Browse Dir »

tangwang
2026-04-01 11:47:33 +0800

dedd31c5 1. 搜索 recall 池「1 分」条数（DEFAULT_SEARCH_RECALL_TOP_K） ... Browse Dir »

scripts/evaluation/eval_framework/constants.py：500 → 200
Rebuild 里 rank <= recall_n 的 rerank_score: 1.0 仍按该 K 生效。
2. LLM 批次上下限
最少批次：DEFAULT_REBUILD_MIN_LLM_BATCHES 20 → 10
最多批次：仍为 40（未改）
3. 提前结束条件（_annotate_rebuild_batches）
在已跑满 min_batches 之后，对每个批次：

本批无 Exact（exact_n == 0），且满足其一即视为 bad batch：
irrelevant_ratio >= 0.94
或 (irrelevant + Low Relevant) / n >= 0.96（弱相关用 RELEVANCE_LOW）
连续 2 个 bad batch 则 early stop（原先是连续 3 次、irrelevant >
0.92）。

批次日志里增加了 low_ratio、irrelevant_plus_low_ratio；rebuild
元数据里增加了 rebuild_irrel_low_combined_stop_ratio。

4. CLI
--search-recall-top-k 说明改为默认 200
--rebuild-min-batches 说明改为默认 10
--rebuild-irrelevant-stop-ratio / --rebuild-irrelevant-stop-streak
说明与新逻辑一致
新增 --rebuild-irrel-low-combined-stop-ratio（默认 0.96）

2026-04-01 11:22:59 +0800

a3734f13 eval任务美国地区不支持batch调用，改为在线调用 Browse Dir »

tangwang
2026-04-01 10:40:32 +0800
a345b01f eval framework Browse Dir »

tangwang
2026-04-01 10:00:45 +0800
46d94a05 评估标准修改 Browse Dir »

tangwang
2026-04-01 09:40:39 +0800
bdb65283 标注框架批量标注 Browse Dir »

tangwang
2026-04-01 09:34:12 +0800
167f33b4 eval框架前端 Browse Dir »

tangwang
2026-04-01 07:40:04 +0800

31 Mar, 2026

9 commits

d172c259 eval框架 Browse Dir »

tangwang
2026-03-31 23:27:53 +0800
3ac1f8d1 评估标准优化 Browse Dir »

tangwang
2026-03-31 22:48:50 +0800
3984ec64 evalution 标注标准优化 ... Browse Dir »
```
Made-with: Cursor
```
tangwang
2026-03-31 20:54:22 +0800
c81b0fc1 scripts/evaluation/eval_framework Browse Dir »

tangwang
2026-03-31 19:54:24 +0800
7b8d9e1a 评估框架的启动脚本 Browse Dir »

tangwang
2026-03-31 19:36:47 +0800
f8e7cb97 evalution framework Browse Dir »

tangwang
2026-03-31 18:53:54 +0800
881d338b 评估框架 Browse Dir »

tangwang
2026-03-31 18:25:19 +0800
432d1c88 评估框架 Browse Dir »

tangwang
2026-03-31 17:12:01 +0800
267920e5 eval docs Browse Dir »

tangwang
2026-03-31 13:54:01 +0800