README.md
性能测试报告索引
本目录存放各次压测/矩阵的原始 JSON 与说明。推荐复用仓库脚本,避免重复造轮子:
| 脚本 | 用途 |
|---|---|
benchmarks/perf_api_benchmark.py |
搜索后端、向量、翻译、重排等 HTTP 接口压测;支持 --embed-text-priority / --embed-image-priority 与 benchmarks/perf_cases.json.example |
历史矩阵示例(并发扫描):
2026-03-12/matrix_report/summary.md— 与summary.json同目录
2026-03-20 — 向量服务 priority 参数烟测
环境:本机 127.0.0.1:6005(文本)、127.0.0.1:6008(图片),命令与结果见同目录 JSON:
| 报告文件 | 场景 | 说明 |
|---|---|---|
2026-03-20_embed_text_p0.json |
embed_text |
priority=0(默认),8s,并发 10 |
2026-03-20_embed_text_p1.json |
embed_text |
--embed-text-priority 1,8s,并发 10 |
2026-03-20_embed_image_p0.json |
embed_image |
priority=0,8s,并发 5 |
2026-03-20_embed_image_p1.json |
embed_image |
--embed-image-priority 1,8s,并发 5 |
复现示例:
source activate.sh
python benchmarks/perf_api_benchmark.py --scenario embed_text --duration 8 --concurrency 10 --timeout 30 --output perf_reports/2026-03-20_embed_text_p0.json
python benchmarks/perf_api_benchmark.py --scenario embed_text --duration 8 --concurrency 10 --embed-text-priority 1 --output perf_reports/2026-03-20_embed_text_p1.json
python benchmarks/perf_api_benchmark.py --scenario embed_image --duration 8 --concurrency 5 --timeout 60 --output perf_reports/2026-03-20_embed_image_p0.json
python benchmarks/perf_api_benchmark.py --scenario embed_image --duration 8 --concurrency 5 --embed-image-priority 1 --output perf_reports/2026-03-20_embed_image_p1.json
说明:本次为 8 秒 smoke,与 2026-03-12 矩阵的时长/并发不可直接横向对比;仅验证 priority 参数下服务仍返回 200 且 payload 校验通过。