测试结果-perfermance_test.txt
4.59 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
============================================================
Embedding API 性能测试
============================================================
选择测试模式:
1. 顺序测试 (Sequential)
2. 并发测试 (Concurrent)
3. 两种模式都测试
请输入选择 (1/2/3, 默认1): 3
============================================================
测试模型: bge-m3
============================================================
开始并发测试模型: bge-m3
测试次数: 1000, 并发数: 10
已完成 100/1000 次请求...
已完成 200/1000 次请求...
已完成 300/1000 次请求...
已完成 400/1000 次请求...
已完成 500/1000 次请求...
已完成 600/1000 次请求...
已完成 700/1000 次请求...
已完成 800/1000 次请求...
已完成 900/1000 次请求...
已完成 1000/1000 次请求...
============================================================
性能测试结果 - bge-m3
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 212.9068秒
平均延迟: 0.2129秒
最小延迟: 0.0507秒
最大延迟: 0.6196秒
P50延迟: 0.0942秒
P95延迟: 0.5580秒
P99延迟: 0.5884秒
标准差: 0.2010秒
QPS: 4.70 请求/秒
============================================================
开始顺序测试模型: bge-m3
测试次数: 1000
已完成 100/1000 次请求...
已完成 200/1000 次请求...
已完成 300/1000 次请求...
已完成 400/1000 次请求...
已完成 500/1000 次请求...
已完成 600/1000 次请求...
已完成 700/1000 次请求...
已完成 800/1000 次请求...
已完成 900/1000 次请求...
============================================================
性能测试结果 - bge-m3
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 81.7646秒
平均延迟: 0.0818秒
最小延迟: 0.0328秒
最大延迟: 0.5812秒
P50延迟: 0.0347秒
P95延迟: 0.4893秒
P99延迟: 0.5047秒
标准差: 0.1377秒
QPS: 12.23 请求/秒
============================================================
============================================================
测试模型: Qwen3-Embedding-0.6B
============================================================
开始并发测试模型: Qwen3-Embedding-0.6B
测试次数: 1000, 并发数: 10
已完成 100/1000 次请求...
已完成 200/1000 次请求...
已完成 300/1000 次请求...
已完成 400/1000 次请求...
已完成 500/1000 次请求...
已完成 600/1000 次请求...
已完成 700/1000 次请求...
已完成 800/1000 次请求...
已完成 900/1000 次请求...
已完成 1000/1000 次请求...
============================================================
性能测试结果 - Qwen3-Embedding-0.6B
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 210.1917秒
平均延迟: 0.2102秒
最小延迟: 0.0651秒
最大延迟: 0.6659秒
P50延迟: 0.1123秒
P95延迟: 0.5845秒
P99延迟: 0.6210秒
标准差: 0.1877秒
QPS: 4.76 请求/秒
============================================================
开始顺序测试模型: Qwen3-Embedding-0.6B
测试次数: 1000
已完成 100/1000 次请求...
已完成 200/1000 次请求...
已完成 300/1000 次请求...
已完成 400/1000 次请求...
已完成 500/1000 次请求...
已完成 600/1000 次请求...
已完成 700/1000 次请求...
已完成 800/1000 次请求...
已完成 900/1000 次请求...
============================================================
性能测试结果 - Qwen3-Embedding-0.6B
============================================================
总请求数: 1000
成功请求: 1000
失败请求: 0
成功率: 100.00%
总耗时: 109.9795秒
平均延迟: 0.1100秒
最小延迟: 0.0571秒
最大延迟: 0.5806秒
P50延迟: 0.0600秒
P95延迟: 0.5648秒
P99延迟: 0.5745秒
标准差: 0.1494秒
QPS: 9.09 请求/秒
============================================================
结果已保存到: performance_results.json
============================================================
性能测试汇总对比
============================================================
模型: bge-m3 (concurrent)
QPS: 4.70
平均延迟: 0.2129秒
成功率: 100.00%
模型: bge-m3 (sequential)
QPS: 12.23
平均延迟: 0.0818秒
成功率: 100.00%
模型: Qwen3-Embedding-0.6B (concurrent)
QPS: 4.76
平均延迟: 0.2102秒
成功率: 100.00%
模型: Qwen3-Embedding-0.6B (sequential)
QPS: 9.09
平均延迟: 0.1100秒
成功率: 100.00%