Name Last Update
..
2026-03-12/matrix_report Loading commit data...
20260311/reranker_1000docs Loading commit data...
20260317/translation_local_models Loading commit data...
20260318 Loading commit data...
20260319 Loading commit data...
reranker_vllm_instruction/2026-03-25 Loading commit data...
README.md Loading commit data...

README.md

性能测试报告索引

本目录存放各次压测/矩阵的原始 JSON 与说明。推荐复用仓库脚本,避免重复造轮子:

脚本 用途
scripts/perf_api_benchmark.py 搜索后端、向量、翻译、重排等 HTTP 接口压测;支持 --embed-text-priority / --embed-image-priorityscripts/perf_cases.json.example

历史矩阵示例(并发扫描):

  • 2026-03-12/matrix_report/summary.md — 与 summary.json 同目录

2026-03-20 — 向量服务 priority 参数烟测

环境:本机 127.0.0.1:6005(文本)、127.0.0.1:6008(图片),命令与结果见同目录 JSON:

报告文件 场景 说明
2026-03-20_embed_text_p0.json embed_text priority=0(默认),8s,并发 10
2026-03-20_embed_text_p1.json embed_text --embed-text-priority 1,8s,并发 10
2026-03-20_embed_image_p0.json embed_image priority=0,8s,并发 5
2026-03-20_embed_image_p1.json embed_image --embed-image-priority 1,8s,并发 5

复现示例:

source activate.sh
python scripts/perf_api_benchmark.py --scenario embed_text --duration 8 --concurrency 10 --timeout 30 --output perf_reports/2026-03-20_embed_text_p0.json
python scripts/perf_api_benchmark.py --scenario embed_text --duration 8 --concurrency 10 --embed-text-priority 1 --output perf_reports/2026-03-20_embed_text_p1.json
python scripts/perf_api_benchmark.py --scenario embed_image --duration 8 --concurrency 5 --timeout 60 --output perf_reports/2026-03-20_embed_image_p0.json
python scripts/perf_api_benchmark.py --scenario embed_image --duration 8 --concurrency 5 --embed-image-priority 1 --output perf_reports/2026-03-20_embed_image_p1.json

说明:本次为 8 秒 smoke,与 2026-03-12 矩阵的时长/并发不可直接横向对比;仅验证 priority 参数下服务仍返回 200 且 payload 校验通过。