$ p perfermance_test_http.py API连接正常,开始性能测试... ============================================================ Embedding API 性能测试 (HTTP) ============================================================ 选择测试模式: 1. 顺序测试 (Sequential) 2. 并发测试 (Concurrent) 3. 两种模式都测试 请输入选择 (1/2/3, 默认1): 3 ============================================================ 测试模型: bge-m3 ============================================================ 开始并发测试模型: bge-m3 测试次数: 1000, 并发数: 10 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... 已完成 1000/1000 次请求... ============================================================ 性能测试结果 - bge-m3 ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 145.1439秒 平均延迟: 0.1451秒 最小延迟: 0.0311秒 最大延迟: 0.5770秒 P50延迟: 0.0599秒 P95延迟: 0.5151秒 P99延迟: 0.5704秒 标准差: 0.1789秒 QPS: 6.89 请求/秒 ============================================================ 开始顺序测试模型: bge-m3 测试次数: 1000 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... ============================================================ 性能测试结果 - bge-m3 ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 74.5284秒 平均延迟: 0.0745秒 最小延迟: 0.0271秒 最大延迟: 0.5767秒 P50延迟: 0.0286秒 P95延迟: 0.4797秒 P99延迟: 0.5037秒 标准差: 0.1364秒 QPS: 13.42 请求/秒 ============================================================ ============================================================ 测试模型: Qwen3-Embedding-0.6B ============================================================ 开始并发测试模型: Qwen3-Embedding-0.6B 测试次数: 1000, 并发数: 10 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... 已完成 1000/1000 次请求... ============================================================ 性能测试结果 - Qwen3-Embedding-0.6B ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 195.7997秒 平均延迟: 0.1958秒 最小延迟: 0.0564秒 最大延迟: 0.6201秒 P50延迟: 0.1050秒 P95延迟: 0.5674秒 P99延迟: 0.5994秒 标准差: 0.1829秒 QPS: 5.11 请求/秒 ============================================================ 开始顺序测试模型: Qwen3-Embedding-0.6B 测试次数: 1000 已完成 100/1000 次请求... 已完成 200/1000 次请求... 已完成 300/1000 次请求... 已完成 400/1000 次请求... 已完成 500/1000 次请求... 已完成 600/1000 次请求... 已完成 700/1000 次请求... 已完成 800/1000 次请求... 已完成 900/1000 次请求... ============================================================ 性能测试结果 - Qwen3-Embedding-0.6B ============================================================ 总请求数: 1000 成功请求: 1000 失败请求: 0 成功率: 100.00% 总耗时: 100.2533秒 平均延迟: 0.1003秒 最小延迟: 0.0513秒 最大延迟: 0.6249秒 P50延迟: 0.0539秒 P95延迟: 0.4993秒 P99延迟: 0.5180秒 标准差: 0.1354秒 QPS: 9.97 请求/秒 ============================================================ 结果已保存到: performance_results.json ============================================================ 性能测试汇总对比 ============================================================ 模型: bge-m3 (concurrent) QPS: 6.89 平均延迟: 0.1451秒 成功率: 100.00% 模型: bge-m3 (sequential) QPS: 13.42 平均延迟: 0.0745秒 成功率: 100.00% 模型: Qwen3-Embedding-0.6B (concurrent) QPS: 5.11 平均延迟: 0.1958秒 成功率: 100.00% 模型: Qwen3-Embedding-0.6B (sequential) QPS: 9.97 平均延迟: 0.1003秒 成功率: 100.00%