测试结果-perfermance_test.txt 4.59 KB
============================================================
Embedding API 性能测试
============================================================

选择测试模式:
1. 顺序测试 (Sequential)
2. 并发测试 (Concurrent)
3. 两种模式都测试
请输入选择 (1/2/3, 默认1): 3

============================================================
测试模型: bge-m3
============================================================

开始并发测试模型: bge-m3
测试次数: 1000, 并发数: 10
  已完成 100/1000 次请求...
  已完成 200/1000 次请求...
  已完成 300/1000 次请求...
  已完成 400/1000 次请求...
  已完成 500/1000 次请求...
  已完成 600/1000 次请求...
  已完成 700/1000 次请求...
  已完成 800/1000 次请求...
  已完成 900/1000 次请求...
  已完成 1000/1000 次请求...

============================================================
性能测试结果 - bge-m3
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 212.9068秒
平均延迟: 0.2129秒
最小延迟: 0.0507秒
最大延迟: 0.6196秒
P50延迟: 0.0942秒
P95延迟: 0.5580秒
P99延迟: 0.5884秒
标准差: 0.2010秒
QPS: 4.70 请求/秒
============================================================

开始顺序测试模型: bge-m3
测试次数: 1000
  已完成 100/1000 次请求...
  已完成 200/1000 次请求...
  已完成 300/1000 次请求...
  已完成 400/1000 次请求...
  已完成 500/1000 次请求...
  已完成 600/1000 次请求...
  已完成 700/1000 次请求...
  已完成 800/1000 次请求...
  已完成 900/1000 次请求...

============================================================
性能测试结果 - bge-m3
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 81.7646秒
平均延迟: 0.0818秒
最小延迟: 0.0328秒
最大延迟: 0.5812秒
P50延迟: 0.0347秒
P95延迟: 0.4893秒
P99延迟: 0.5047秒
标准差: 0.1377秒
QPS: 12.23 请求/秒
============================================================

============================================================
测试模型: Qwen3-Embedding-0.6B
============================================================

开始并发测试模型: Qwen3-Embedding-0.6B
测试次数: 1000, 并发数: 10
  已完成 100/1000 次请求...
  已完成 200/1000 次请求...
  已完成 300/1000 次请求...
  已完成 400/1000 次请求...
  已完成 500/1000 次请求...
  已完成 600/1000 次请求...
  已完成 700/1000 次请求...
  已完成 800/1000 次请求...
  已完成 900/1000 次请求...
  已完成 1000/1000 次请求...

============================================================
性能测试结果 - Qwen3-Embedding-0.6B
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 210.1917秒
平均延迟: 0.2102秒
最小延迟: 0.0651秒
最大延迟: 0.6659秒
P50延迟: 0.1123秒
P95延迟: 0.5845秒
P99延迟: 0.6210秒
标准差: 0.1877秒
QPS: 4.76 请求/秒
============================================================

开始顺序测试模型: Qwen3-Embedding-0.6B
测试次数: 1000
  已完成 100/1000 次请求...

  已完成 200/1000 次请求...
  已完成 300/1000 次请求...
  已完成 400/1000 次请求...
  已完成 500/1000 次请求...
  已完成 600/1000 次请求...
  已完成 700/1000 次请求...
  已完成 800/1000 次请求...
  已完成 900/1000 次请求...

============================================================
性能测试结果 - Qwen3-Embedding-0.6B
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 109.9795秒
平均延迟: 0.1100秒
最小延迟: 0.0571秒
最大延迟: 0.5806秒
P50延迟: 0.0600秒
P95延迟: 0.5648秒
P99延迟: 0.5745秒
标准差: 0.1494秒
QPS: 9.09 请求/秒
============================================================

结果已保存到: performance_results.json

============================================================
性能测试汇总对比
============================================================

模型: bge-m3 (concurrent)
  QPS: 4.70
  平均延迟: 0.2129秒
  成功率: 100.00%

模型: bge-m3 (sequential)
  QPS: 12.23
  平均延迟: 0.0818秒
  成功率: 100.00%

模型: Qwen3-Embedding-0.6B (concurrent)
  QPS: 4.76
  平均延迟: 0.2102秒
  成功率: 100.00%

模型: Qwen3-Embedding-0.6B (sequential)
  QPS: 9.09
  平均延迟: 0.1100秒
  成功率: 100.00%