Commit 472cca0cf678e716c641c723bbb1af1857453998
1 parent
72e7256a
doc
Showing
3 changed files
with
225 additions
and
0 deletions
Show diff stats
README.md
| @@ -2,6 +2,50 @@ | @@ -2,6 +2,50 @@ | ||
| 2 | # TODO | 2 | # TODO |
| 3 | 多语言: | 3 | 多语言: |
| 4 | 语义: | 4 | 语义: |
| 5 | +多语言: | ||
| 6 | +1. dis_max的方式 | ||
| 7 | +"query" : { | ||
| 8 | + "dis_max" : { | ||
| 9 | + "queries" : [ | ||
| 10 | + {"match" : { "title_en" : xxx }}, | ||
| 11 | + {"match" : { "title_zh" : xxx }}, | ||
| 12 | + {"match" : { "title_xx" : xxx }} | ||
| 13 | + ], | ||
| 14 | + "tie_breakler" : 0.8 | ||
| 15 | + } | ||
| 16 | +} | ||
| 17 | + | ||
| 18 | + | ||
| 19 | + | ||
| 20 | +"corss_field": | ||
| 21 | +"multi_match" : { | ||
| 22 | + "query" : | ||
| 23 | + "fields" : [...], | ||
| 24 | + "type": "cross_fields", | ||
| 25 | + "operator" : "and" | ||
| 26 | +} | ||
| 27 | + | ||
| 28 | + | ||
| 29 | +支持英文的拼写接错: | ||
| 30 | +title: multi_field | ||
| 31 | +"query" : { | ||
| 32 | + "query_string" : { | ||
| 33 | + "query": "xxx", | ||
| 34 | + "default_field": "title.ngram", | ||
| 35 | + "minimum_should_match": "85%" | ||
| 36 | + } | ||
| 37 | +} | ||
| 38 | + | ||
| 39 | + | ||
| 40 | + | ||
| 41 | +业务提权: | ||
| 42 | +rescore: window_size query_weight rescore_query_weight | ||
| 43 | + | ||
| 44 | +function_score: | ||
| 45 | +boost | ||
| 46 | +以及 可以把每个子查询用function_score包一下 | ||
| 47 | + | ||
| 48 | + | ||
| 5 | 49 | ||
| 6 | 50 | ||
| 7 | query anchor | 51 | query anchor |
docs/常用查询 - ES.md
| @@ -5,6 +5,21 @@ | @@ -5,6 +5,21 @@ | ||
| 5 | # ====================================== | 5 | # ====================================== |
| 6 | 6 | ||
| 7 | ### 1. 根据 tenant_id / spu_id 查询 | 7 | ### 1. 根据 tenant_id / spu_id 查询 |
| 8 | +curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products_tenant_170/_search?pretty' -H 'Content-Type: application/json' -d '{ | ||
| 9 | +{ | ||
| 10 | + "size": 11, | ||
| 11 | + "_source": "*", | ||
| 12 | + "query": { | ||
| 13 | + "bool": { | ||
| 14 | + "filter": [ | ||
| 15 | + { "term": {"spu_id" : 206150} }, | ||
| 16 | + { "term": { "tenant_id": "170" } } | ||
| 17 | + ] | ||
| 18 | + } | ||
| 19 | + } | ||
| 20 | + }' | ||
| 21 | + | ||
| 22 | + | ||
| 8 | curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products/_search?pretty' -H 'Content-Type: application/json' -d '{ | 23 | curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products/_search?pretty' -H 'Content-Type: application/json' -d '{ |
| 9 | "size": 100, | 24 | "size": 100, |
| 10 | "_source": ["title_zh", "title_en"], | 25 | "_source": ["title_zh", "title_en"], |
third-party/xinference/测试结果-perfermance_test.txt
| @@ -0,0 +1,166 @@ | @@ -0,0 +1,166 @@ | ||
| 1 | +============================================================ | ||
| 2 | +Embedding API 性能测试 | ||
| 3 | +============================================================ | ||
| 4 | + | ||
| 5 | +选择测试模式: | ||
| 6 | +1. 顺序测试 (Sequential) | ||
| 7 | +2. 并发测试 (Concurrent) | ||
| 8 | +3. 两种模式都测试 | ||
| 9 | +请输入选择 (1/2/3, 默认1): 3 | ||
| 10 | + | ||
| 11 | +============================================================ | ||
| 12 | +测试模型: bge-m3 | ||
| 13 | +============================================================ | ||
| 14 | + | ||
| 15 | +开始并发测试模型: bge-m3 | ||
| 16 | +测试次数: 1000, 并发数: 10 | ||
| 17 | + 已完成 100/1000 次请求... | ||
| 18 | + 已完成 200/1000 次请求... | ||
| 19 | + 已完成 300/1000 次请求... | ||
| 20 | + 已完成 400/1000 次请求... | ||
| 21 | + 已完成 500/1000 次请求... | ||
| 22 | + 已完成 600/1000 次请求... | ||
| 23 | + 已完成 700/1000 次请求... | ||
| 24 | + 已完成 800/1000 次请求... | ||
| 25 | + 已完成 900/1000 次请求... | ||
| 26 | + 已完成 1000/1000 次请求... | ||
| 27 | + | ||
| 28 | +============================================================ | ||
| 29 | +性能测试结果 - bge-m3 | ||
| 30 | +============================================================ | ||
| 31 | +总请求数: 1000 | ||
| 32 | +成功请求: 1000 | ||
| 33 | +失败请求: 0 | ||
| 34 | +成功率: 100.00% | ||
| 35 | +总耗时: 212.9068秒 | ||
| 36 | +平均延迟: 0.2129秒 | ||
| 37 | +最小延迟: 0.0507秒 | ||
| 38 | +最大延迟: 0.6196秒 | ||
| 39 | +P50延迟: 0.0942秒 | ||
| 40 | +P95延迟: 0.5580秒 | ||
| 41 | +P99延迟: 0.5884秒 | ||
| 42 | +标准差: 0.2010秒 | ||
| 43 | +QPS: 4.70 请求/秒 | ||
| 44 | +============================================================ | ||
| 45 | + | ||
| 46 | +开始顺序测试模型: bge-m3 | ||
| 47 | +测试次数: 1000 | ||
| 48 | + 已完成 100/1000 次请求... | ||
| 49 | + 已完成 200/1000 次请求... | ||
| 50 | + 已完成 300/1000 次请求... | ||
| 51 | + 已完成 400/1000 次请求... | ||
| 52 | + 已完成 500/1000 次请求... | ||
| 53 | + 已完成 600/1000 次请求... | ||
| 54 | + 已完成 700/1000 次请求... | ||
| 55 | + 已完成 800/1000 次请求... | ||
| 56 | + 已完成 900/1000 次请求... | ||
| 57 | + | ||
| 58 | +============================================================ | ||
| 59 | +性能测试结果 - bge-m3 | ||
| 60 | +============================================================ | ||
| 61 | +总请求数: 1000 | ||
| 62 | +成功请求: 1000 | ||
| 63 | +失败请求: 0 | ||
| 64 | +成功率: 100.00% | ||
| 65 | +总耗时: 81.7646秒 | ||
| 66 | +平均延迟: 0.0818秒 | ||
| 67 | +最小延迟: 0.0328秒 | ||
| 68 | +最大延迟: 0.5812秒 | ||
| 69 | +P50延迟: 0.0347秒 | ||
| 70 | +P95延迟: 0.4893秒 | ||
| 71 | +P99延迟: 0.5047秒 | ||
| 72 | +标准差: 0.1377秒 | ||
| 73 | +QPS: 12.23 请求/秒 | ||
| 74 | +============================================================ | ||
| 75 | + | ||
| 76 | +============================================================ | ||
| 77 | +测试模型: Qwen3-Embedding-0.6B | ||
| 78 | +============================================================ | ||
| 79 | + | ||
| 80 | +开始并发测试模型: Qwen3-Embedding-0.6B | ||
| 81 | +测试次数: 1000, 并发数: 10 | ||
| 82 | + 已完成 100/1000 次请求... | ||
| 83 | + 已完成 200/1000 次请求... | ||
| 84 | + 已完成 300/1000 次请求... | ||
| 85 | + 已完成 400/1000 次请求... | ||
| 86 | + 已完成 500/1000 次请求... | ||
| 87 | + 已完成 600/1000 次请求... | ||
| 88 | + 已完成 700/1000 次请求... | ||
| 89 | + 已完成 800/1000 次请求... | ||
| 90 | + 已完成 900/1000 次请求... | ||
| 91 | + 已完成 1000/1000 次请求... | ||
| 92 | + | ||
| 93 | +============================================================ | ||
| 94 | +性能测试结果 - Qwen3-Embedding-0.6B | ||
| 95 | +============================================================ | ||
| 96 | +总请求数: 1000 | ||
| 97 | +成功请求: 1000 | ||
| 98 | +失败请求: 0 | ||
| 99 | +成功率: 100.00% | ||
| 100 | +总耗时: 210.1917秒 | ||
| 101 | +平均延迟: 0.2102秒 | ||
| 102 | +最小延迟: 0.0651秒 | ||
| 103 | +最大延迟: 0.6659秒 | ||
| 104 | +P50延迟: 0.1123秒 | ||
| 105 | +P95延迟: 0.5845秒 | ||
| 106 | +P99延迟: 0.6210秒 | ||
| 107 | +标准差: 0.1877秒 | ||
| 108 | +QPS: 4.76 请求/秒 | ||
| 109 | +============================================================ | ||
| 110 | + | ||
| 111 | +开始顺序测试模型: Qwen3-Embedding-0.6B | ||
| 112 | +测试次数: 1000 | ||
| 113 | + 已完成 100/1000 次请求... | ||
| 114 | + | ||
| 115 | + 已完成 200/1000 次请求... | ||
| 116 | + 已完成 300/1000 次请求... | ||
| 117 | + 已完成 400/1000 次请求... | ||
| 118 | + 已完成 500/1000 次请求... | ||
| 119 | + 已完成 600/1000 次请求... | ||
| 120 | + 已完成 700/1000 次请求... | ||
| 121 | + 已完成 800/1000 次请求... | ||
| 122 | + 已完成 900/1000 次请求... | ||
| 123 | + | ||
| 124 | +============================================================ | ||
| 125 | +性能测试结果 - Qwen3-Embedding-0.6B | ||
| 126 | +============================================================ | ||
| 127 | +总请求数: 1000 | ||
| 128 | +成功请求: 1000 | ||
| 129 | +失败请求: 0 | ||
| 130 | +成功率: 100.00% | ||
| 131 | +总耗时: 109.9795秒 | ||
| 132 | +平均延迟: 0.1100秒 | ||
| 133 | +最小延迟: 0.0571秒 | ||
| 134 | +最大延迟: 0.5806秒 | ||
| 135 | +P50延迟: 0.0600秒 | ||
| 136 | +P95延迟: 0.5648秒 | ||
| 137 | +P99延迟: 0.5745秒 | ||
| 138 | +标准差: 0.1494秒 | ||
| 139 | +QPS: 9.09 请求/秒 | ||
| 140 | +============================================================ | ||
| 141 | + | ||
| 142 | +结果已保存到: performance_results.json | ||
| 143 | + | ||
| 144 | +============================================================ | ||
| 145 | +性能测试汇总对比 | ||
| 146 | +============================================================ | ||
| 147 | + | ||
| 148 | +模型: bge-m3 (concurrent) | ||
| 149 | + QPS: 4.70 | ||
| 150 | + 平均延迟: 0.2129秒 | ||
| 151 | + 成功率: 100.00% | ||
| 152 | + | ||
| 153 | +模型: bge-m3 (sequential) | ||
| 154 | + QPS: 12.23 | ||
| 155 | + 平均延迟: 0.0818秒 | ||
| 156 | + 成功率: 100.00% | ||
| 157 | + | ||
| 158 | +模型: Qwen3-Embedding-0.6B (concurrent) | ||
| 159 | + QPS: 4.76 | ||
| 160 | + 平均延迟: 0.2102秒 | ||
| 161 | + 成功率: 100.00% | ||
| 162 | + | ||
| 163 | +模型: Qwen3-Embedding-0.6B (sequential) | ||
| 164 | + QPS: 9.09 | ||
| 165 | + 平均延迟: 0.1100秒 | ||
| 166 | + 成功率: 100.00% |