============================================================ Embedding API 性能测试 ============================================================ 选择测试模式: 1. 顺序测试 (Sequential) 2. 并发测试 (Concurrent) 3. 两种模式都测试 请输入选择 (1/2/3, 默认1): 3 ============================================================ 测试模型: bge-m3 ============================================================ 开始并发测试模型: bge-m3 测试次数: 1000, 并发数: 10 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... 已完成 1000/1000 次请求... ============================================================ 性能测试结果 - bge-m3 ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 212.9068秒 平均延迟: 0.2129秒 最小延迟: 0.0507秒 最大延迟: 0.6196秒 P50延迟: 0.0942秒 P95延迟: 0.5580秒 P99延迟: 0.5884秒 标准差: 0.2010秒 QPS: 4.70 请求/秒 ============================================================ 开始顺序测试模型: bge-m3 测试次数: 1000 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... ============================================================ 性能测试结果 - bge-m3 ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 81.7646秒 平均延迟: 0.0818秒 最小延迟: 0.0328秒 最大延迟: 0.5812秒 P50延迟: 0.0347秒 P95延迟: 0.4893秒 P99延迟: 0.5047秒 标准差: 0.1377秒 QPS: 12.23 请求/秒 ============================================================ ============================================================ 测试模型: Qwen3-Embedding-0.6B ============================================================ 开始并发测试模型: Qwen3-Embedding-0.6B 测试次数: 1000, 并发数: 10 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... 已完成 1000/1000 次请求... ============================================================ 性能测试结果 - Qwen3-Embedding-0.6B ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 210.1917秒 平均延迟: 0.2102秒 最小延迟: 0.0651秒 最大延迟: 0.6659秒 P50延迟: 0.1123秒 P95延迟: 0.5845秒 P99延迟: 0.6210秒 标准差: 0.1877秒 QPS: 4.76 请求/秒 ============================================================ 开始顺序测试模型: Qwen3-Embedding-0.6B 测试次数: 1000 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... ============================================================ 性能测试结果 - Qwen3-Embedding-0.6B ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 109.9795秒 平均延迟: 0.1100秒 最小延迟: 0.0571秒 最大延迟: 0.5806秒 P50延迟: 0.0600秒 P95延迟: 0.5648秒 P99延迟: 0.5745秒 标准差: 0.1494秒 QPS: 9.09 请求/秒 ============================================================ 结果已保存到: performance_results.json ============================================================ 性能测试汇总对比 ============================================================ 模型: bge-m3 (concurrent) QPS: 4.70 平均延迟: 0.2129秒 成功率: 100.00% 模型: bge-m3 (sequential) QPS: 12.23 平均延迟: 0.0818秒 成功率: 100.00% 模型: Qwen3-Embedding-0.6B (concurrent) QPS: 4.76 平均延迟: 0.2102秒 成功率: 100.00% 模型: Qwen3-Embedding-0.6B (sequential) QPS: 9.09 平均延迟: 0.1100秒 成功率: 100.00%