Blame view

third-party/xinference/测试结果-perfermance_test.txt 4.59 KB
472cca0c   tangwang   doc
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
  ============================================================
  Embedding API 性能测试
  ============================================================
  
  选择测试模式:
  1. 顺序测试 (Sequential)
  2. 并发测试 (Concurrent)
  3. 两种模式都测试
  请输入选择 (1/2/3, 默认1): 3
  
  ============================================================
  测试模型: bge-m3
  ============================================================
  
  开始并发测试模型: bge-m3
  测试次数: 1000, 并发数: 10
    已完成 100/1000 次请求...
    已完成 200/1000 次请求...
    已完成 300/1000 次请求...
    已完成 400/1000 次请求...
    已完成 500/1000 次请求...
    已完成 600/1000 次请求...
    已完成 700/1000 次请求...
    已完成 800/1000 次请求...
    已完成 900/1000 次请求...
    已完成 1000/1000 次请求...
  
  ============================================================
  性能测试结果 - bge-m3
  ============================================================
  总请求数: 1000
  成功请求: 1000
  失败请求: 0
  成功率: 100.00%
  总耗时: 212.9068秒
  平均延迟: 0.2129秒
  最小延迟: 0.0507秒
  最大延迟: 0.6196秒
  P50延迟: 0.0942秒
  P95延迟: 0.5580秒
  P99延迟: 0.5884秒
  标准差: 0.2010秒
  QPS: 4.70 请求/秒
  ============================================================
  
  开始顺序测试模型: bge-m3
  测试次数: 1000
    已完成 100/1000 次请求...
    已完成 200/1000 次请求...
    已完成 300/1000 次请求...
    已完成 400/1000 次请求...
    已完成 500/1000 次请求...
    已完成 600/1000 次请求...
    已完成 700/1000 次请求...
    已完成 800/1000 次请求...
    已完成 900/1000 次请求...
  
  ============================================================
  性能测试结果 - bge-m3
  ============================================================
  总请求数: 1000
  成功请求: 1000
  失败请求: 0
  成功率: 100.00%
  总耗时: 81.7646秒
  平均延迟: 0.0818秒
  最小延迟: 0.0328秒
  最大延迟: 0.5812秒
  P50延迟: 0.0347秒
  P95延迟: 0.4893秒
  P99延迟: 0.5047秒
  标准差: 0.1377秒
  QPS: 12.23 请求/秒
  ============================================================
  
  ============================================================
  测试模型: Qwen3-Embedding-0.6B
  ============================================================
  
  开始并发测试模型: Qwen3-Embedding-0.6B
  测试次数: 1000, 并发数: 10
    已完成 100/1000 次请求...
    已完成 200/1000 次请求...
    已完成 300/1000 次请求...
    已完成 400/1000 次请求...
    已完成 500/1000 次请求...
    已完成 600/1000 次请求...
    已完成 700/1000 次请求...
    已完成 800/1000 次请求...
    已完成 900/1000 次请求...
    已完成 1000/1000 次请求...
  
  ============================================================
  性能测试结果 - Qwen3-Embedding-0.6B
  ============================================================
  总请求数: 1000
  成功请求: 1000
  失败请求: 0
  成功率: 100.00%
  总耗时: 210.1917秒
  平均延迟: 0.2102秒
  最小延迟: 0.0651秒
  最大延迟: 0.6659秒
  P50延迟: 0.1123秒
  P95延迟: 0.5845秒
  P99延迟: 0.6210秒
  标准差: 0.1877秒
  QPS: 4.76 请求/秒
  ============================================================
  
  开始顺序测试模型: Qwen3-Embedding-0.6B
  测试次数: 1000
    已完成 100/1000 次请求...
  
    已完成 200/1000 次请求...
    已完成 300/1000 次请求...
    已完成 400/1000 次请求...
    已完成 500/1000 次请求...
    已完成 600/1000 次请求...
    已完成 700/1000 次请求...
    已完成 800/1000 次请求...
    已完成 900/1000 次请求...
  
  ============================================================
  性能测试结果 - Qwen3-Embedding-0.6B
  ============================================================
  总请求数: 1000
  成功请求: 1000
  失败请求: 0
  成功率: 100.00%
  总耗时: 109.9795秒
  平均延迟: 0.1100秒
  最小延迟: 0.0571秒
  最大延迟: 0.5806秒
  P50延迟: 0.0600秒
  P95延迟: 0.5648秒
  P99延迟: 0.5745秒
  标准差: 0.1494秒
  QPS: 9.09 请求/秒
  ============================================================
  
  结果已保存到: performance_results.json
  
  ============================================================
  性能测试汇总对比
  ============================================================
  
  模型: bge-m3 (concurrent)
    QPS: 4.70
    平均延迟: 0.2129秒
    成功率: 100.00%
  
  模型: bge-m3 (sequential)
    QPS: 12.23
    平均延迟: 0.0818秒
    成功率: 100.00%
  
  模型: Qwen3-Embedding-0.6B (concurrent)
    QPS: 4.76
    平均延迟: 0.2102秒
    成功率: 100.00%
  
  模型: Qwen3-Embedding-0.6B (sequential)
    QPS: 9.09
    平均延迟: 0.1100秒
    成功率: 100.00%