ai-saas / saas-search

09 Apr, 2026

1 commit

3abbc95a 重构(scripts): 整理scripts目录，按现架构分类并迁移性能/手动测试脚本 ... Browse File »

问题背景：
- scripts/
  目录下混有服务启动、数据转换、性能压测、临时脚本及历史备份目录
- 存在大量中间迭代遗留信息，不利于维护和新人理解
- 现行服务编排已稳定为 service_ctl up all 的集合：tei / cnclip /
  embedding / embedding-image / translator / reranker / backend /
indexer / frontend / eval-web，不再保留 reranker-fine 默认位

调整内容：
1. 根 scripts/ 收敛为运行、运维、环境、数据处理脚本，并新增
   scripts/README.md 说明文档
2. 性能/压测/调参脚本整体迁至 benchmarks/ 目录，同步更新
   benchmarks/README.md
3. 人工试跑脚本迁至 tests/manual/ 目录，同步更新 tests/manual/README.md
4. 删除明确过时内容：
   - scripts/indexer__old_2025_11/
   - scripts/start.sh
   - scripts/install_server_deps.sh
5. 同步修正以下文档中的路径及过时描述：
   - 根目录 README.md
   - 性能报告相关文档
   - reranker/translation 模块文档

技术细节：
- 性能测试不放常规 tests/
  的原因：这类脚本依赖真实服务、GPU、模型和环境噪声，不适合作为稳定回归门禁；benchmarks/
更贴合其定位
- tests/manual/ 仅存放需要人工启动依赖、手工观察结果的接口试跑脚本
- 所有迁移后的 Python 脚本已通过 py_compile 语法校验
- 所有迁移后的 Shell 脚本已通过 bash -n 语法校验

校验结果：
- py_compile: 通过
- bash -n: 通过

2026-04-09 23:36:06 +0800

02 Apr, 2026

1 commit

41345271 文档更新 Browse File »

tangwang
2026-04-02 19:46:27 +0800

01 Apr, 2026

1 commit

a345b01f eval framework Browse File »

tangwang
2026-04-01 10:00:45 +0800

31 Mar, 2026

2 commits

3ac1f8d1 评估标准优化 Browse File »

tangwang
2026-03-31 22:48:50 +0800
7b8d9e1a 评估框架的启动脚本 Browse File »

tangwang
2026-03-31 19:36:47 +0800

19 Mar, 2026

1 commit

5bac9649 文本 embedding 与图片 embedding 已拆分为两个独立进程 / 端口 Browse File »

tangwang
2026-03-19 13:54:05 +0800

18 Mar, 2026

1 commit

c90f80ed 相关性优化 Browse File »

tangwang
2026-03-18 16:44:27 +0800

12 Mar, 2026

2 commits

c6da6bca add status.sh Browse File »

tangwang
2026-03-12 23:51:43 +0800
7913e2fb 服务管理和监控 Browse File »

tangwang
2026-03-12 23:31:59 +0800

11 Mar, 2026

3 commits

28e57bb1 日志体系优化 Browse File »

tangwang
2026-03-11 23:04:17 +0800

af7ee060 service_ctl 简化为“显式服务清单”模式 ... Browse File »

去掉 START_* 控制变量逻辑，默认只启动核心服务 backend/indexer/frontend。
可选服务改为显式命令：./scripts/service_ctl.sh start embedding
translator reranker tei cnclip。
统一 translator 端口读取为 TRANSLATION_PORT（移除 TRANSLATOR_PORT
兼容）。
保留未知服务强校验。
关键文件：service_ctl.sh
“重名/歧义”修复
frontend 端口命名统一：FRONTEND_PORT 为主，PORT 仅后备。
start_frontend.sh 显式导出 PORT="${FRONTEND_PORT}"，避免配置了
FRONTEND_PORT 但服务仍跑 6003 的问题。
文件：start_frontend.sh、frontend_server.py、env_config.py
日志/PID 命名治理继续收口
统一规则继续落地为 logs/<service>.log、logs/<service>.pid。
cnclip 保持 logs/cnclip.log + logs/cnclip.pid。
文件：service_ctl.sh、start_cnclip_service.sh、stop_cnclip_service.sh
backend/indexer 启动风格统一补齐相关项
frontend/translator 也对齐到 set -euo pipefail，并用 exec 直启主进程。
文件：start_frontend.sh、start_translator.sh、start_backend.sh、start_indexer.sh
legacy 入口清理
删除：start_servers.py、stop_reranker.sh、stop_translator.sh。
reranker 停止逻辑并入 service_ctl（含 VLLM::EngineCore 清理）。
benchmark 脚本改为统一入口：service_ctl.sh stop reranker。
文件：benchmark_reranker_1000docs.sh

2026-03-11 22:39:39 +0800

7fbca0d7 启动脚本优化 Browse File »

tangwang
2026-03-11 19:23:57 +0800

10 Mar, 2026

2 commits

ff9efda0 suggest Browse File »

tangwang
2026-03-10 20:14:55 +0800
26b910bd refactor service init and tighten multi-tenant search contracts Browse File »

tangwang
2026-03-10 13:09:24 +0800

09 Mar, 2026

3 commits

bc089b43 refactor(reranker): 对齐 Qwen3-Reranker 官方实现 ... Browse File »

config/config.yaml:
- qwen3_vllm: enable_prefix_caching true（启用前缀缓存）
- qwen3_vllm: enforce_eager false（允许 CUDA graph 加速）

reranker/backends/qwen3_vllm.py:
- TokensPrompt 导入改为 vllm.inputs.data（官方路径，兼容性更好）
- 缺失 token 时使用 logprob=-10，与官方一致（原为 1e-10）
- 使用批量 apply_chat_template 替代逐条调用，提升效率
- logprobs 访问改为官方模式：token not in last 时 -10，否则 last[token].logprob

其他: docs、embeddings、README 等文档更新

Made-with: Cursor

2026-03-09 23:48:19 +0800

07cf5a93 START_EMBEDDING=1 START_TRANSLATOR=1 START_RERANKER=1 START_TEI=1 ... Browse File »
```
CNCLIP_DEVICE=cuda TEI_USE_GPU=1 ./scripts/service_ctl.sh start
搜索后端+indexer+测试前段+4个微服务 跑通
```
tangwang
2026-03-09 23:29:07 +0800
ed948666 tidy Browse File »

tangwang
2026-03-09 17:04:00 +0800