Commit 472cca0cf678e716c641c723bbb1af1857453998
1 parent
72e7256a
doc
Showing
3 changed files
with
225 additions
and
0 deletions
Show diff stats
README.md
| ... | ... | @@ -2,6 +2,50 @@ |
| 2 | 2 | # TODO |
| 3 | 3 | 多语言: |
| 4 | 4 | 语义: |
| 5 | +多语言: | |
| 6 | +1. dis_max的方式 | |
| 7 | +"query" : { | |
| 8 | + "dis_max" : { | |
| 9 | + "queries" : [ | |
| 10 | + {"match" : { "title_en" : xxx }}, | |
| 11 | + {"match" : { "title_zh" : xxx }}, | |
| 12 | + {"match" : { "title_xx" : xxx }} | |
| 13 | + ], | |
| 14 | + "tie_breakler" : 0.8 | |
| 15 | + } | |
| 16 | +} | |
| 17 | + | |
| 18 | + | |
| 19 | + | |
| 20 | +"corss_field": | |
| 21 | +"multi_match" : { | |
| 22 | + "query" : | |
| 23 | + "fields" : [...], | |
| 24 | + "type": "cross_fields", | |
| 25 | + "operator" : "and" | |
| 26 | +} | |
| 27 | + | |
| 28 | + | |
| 29 | +支持英文的拼写接错: | |
| 30 | +title: multi_field | |
| 31 | +"query" : { | |
| 32 | + "query_string" : { | |
| 33 | + "query": "xxx", | |
| 34 | + "default_field": "title.ngram", | |
| 35 | + "minimum_should_match": "85%" | |
| 36 | + } | |
| 37 | +} | |
| 38 | + | |
| 39 | + | |
| 40 | + | |
| 41 | +业务提权: | |
| 42 | +rescore: window_size query_weight rescore_query_weight | |
| 43 | + | |
| 44 | +function_score: | |
| 45 | +boost | |
| 46 | +以及 可以把每个子查询用function_score包一下 | |
| 47 | + | |
| 48 | + | |
| 5 | 49 | |
| 6 | 50 | |
| 7 | 51 | query anchor | ... | ... |
docs/常用查询 - ES.md
| ... | ... | @@ -5,6 +5,21 @@ |
| 5 | 5 | # ====================================== |
| 6 | 6 | |
| 7 | 7 | ### 1. 根据 tenant_id / spu_id 查询 |
| 8 | +curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products_tenant_170/_search?pretty' -H 'Content-Type: application/json' -d '{ | |
| 9 | +{ | |
| 10 | + "size": 11, | |
| 11 | + "_source": "*", | |
| 12 | + "query": { | |
| 13 | + "bool": { | |
| 14 | + "filter": [ | |
| 15 | + { "term": {"spu_id" : 206150} }, | |
| 16 | + { "term": { "tenant_id": "170" } } | |
| 17 | + ] | |
| 18 | + } | |
| 19 | + } | |
| 20 | + }' | |
| 21 | + | |
| 22 | + | |
| 8 | 23 | curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products/_search?pretty' -H 'Content-Type: application/json' -d '{ |
| 9 | 24 | "size": 100, |
| 10 | 25 | "_source": ["title_zh", "title_en"], | ... | ... |
third-party/xinference/测试结果-perfermance_test.txt
| ... | ... | @@ -0,0 +1,166 @@ |
| 1 | +============================================================ | |
| 2 | +Embedding API 性能测试 | |
| 3 | +============================================================ | |
| 4 | + | |
| 5 | +选择测试模式: | |
| 6 | +1. 顺序测试 (Sequential) | |
| 7 | +2. 并发测试 (Concurrent) | |
| 8 | +3. 两种模式都测试 | |
| 9 | +请输入选择 (1/2/3, 默认1): 3 | |
| 10 | + | |
| 11 | +============================================================ | |
| 12 | +测试模型: bge-m3 | |
| 13 | +============================================================ | |
| 14 | + | |
| 15 | +开始并发测试模型: bge-m3 | |
| 16 | +测试次数: 1000, 并发数: 10 | |
| 17 | + 已完成 100/1000 次请求... | |
| 18 | + 已完成 200/1000 次请求... | |
| 19 | + 已完成 300/1000 次请求... | |
| 20 | + 已完成 400/1000 次请求... | |
| 21 | + 已完成 500/1000 次请求... | |
| 22 | + 已完成 600/1000 次请求... | |
| 23 | + 已完成 700/1000 次请求... | |
| 24 | + 已完成 800/1000 次请求... | |
| 25 | + 已完成 900/1000 次请求... | |
| 26 | + 已完成 1000/1000 次请求... | |
| 27 | + | |
| 28 | +============================================================ | |
| 29 | +性能测试结果 - bge-m3 | |
| 30 | +============================================================ | |
| 31 | +总请求数: 1000 | |
| 32 | +成功请求: 1000 | |
| 33 | +失败请求: 0 | |
| 34 | +成功率: 100.00% | |
| 35 | +总耗时: 212.9068秒 | |
| 36 | +平均延迟: 0.2129秒 | |
| 37 | +最小延迟: 0.0507秒 | |
| 38 | +最大延迟: 0.6196秒 | |
| 39 | +P50延迟: 0.0942秒 | |
| 40 | +P95延迟: 0.5580秒 | |
| 41 | +P99延迟: 0.5884秒 | |
| 42 | +标准差: 0.2010秒 | |
| 43 | +QPS: 4.70 请求/秒 | |
| 44 | +============================================================ | |
| 45 | + | |
| 46 | +开始顺序测试模型: bge-m3 | |
| 47 | +测试次数: 1000 | |
| 48 | + 已完成 100/1000 次请求... | |
| 49 | + 已完成 200/1000 次请求... | |
| 50 | + 已完成 300/1000 次请求... | |
| 51 | + 已完成 400/1000 次请求... | |
| 52 | + 已完成 500/1000 次请求... | |
| 53 | + 已完成 600/1000 次请求... | |
| 54 | + 已完成 700/1000 次请求... | |
| 55 | + 已完成 800/1000 次请求... | |
| 56 | + 已完成 900/1000 次请求... | |
| 57 | + | |
| 58 | +============================================================ | |
| 59 | +性能测试结果 - bge-m3 | |
| 60 | +============================================================ | |
| 61 | +总请求数: 1000 | |
| 62 | +成功请求: 1000 | |
| 63 | +失败请求: 0 | |
| 64 | +成功率: 100.00% | |
| 65 | +总耗时: 81.7646秒 | |
| 66 | +平均延迟: 0.0818秒 | |
| 67 | +最小延迟: 0.0328秒 | |
| 68 | +最大延迟: 0.5812秒 | |
| 69 | +P50延迟: 0.0347秒 | |
| 70 | +P95延迟: 0.4893秒 | |
| 71 | +P99延迟: 0.5047秒 | |
| 72 | +标准差: 0.1377秒 | |
| 73 | +QPS: 12.23 请求/秒 | |
| 74 | +============================================================ | |
| 75 | + | |
| 76 | +============================================================ | |
| 77 | +测试模型: Qwen3-Embedding-0.6B | |
| 78 | +============================================================ | |
| 79 | + | |
| 80 | +开始并发测试模型: Qwen3-Embedding-0.6B | |
| 81 | +测试次数: 1000, 并发数: 10 | |
| 82 | + 已完成 100/1000 次请求... | |
| 83 | + 已完成 200/1000 次请求... | |
| 84 | + 已完成 300/1000 次请求... | |
| 85 | + 已完成 400/1000 次请求... | |
| 86 | + 已完成 500/1000 次请求... | |
| 87 | + 已完成 600/1000 次请求... | |
| 88 | + 已完成 700/1000 次请求... | |
| 89 | + 已完成 800/1000 次请求... | |
| 90 | + 已完成 900/1000 次请求... | |
| 91 | + 已完成 1000/1000 次请求... | |
| 92 | + | |
| 93 | +============================================================ | |
| 94 | +性能测试结果 - Qwen3-Embedding-0.6B | |
| 95 | +============================================================ | |
| 96 | +总请求数: 1000 | |
| 97 | +成功请求: 1000 | |
| 98 | +失败请求: 0 | |
| 99 | +成功率: 100.00% | |
| 100 | +总耗时: 210.1917秒 | |
| 101 | +平均延迟: 0.2102秒 | |
| 102 | +最小延迟: 0.0651秒 | |
| 103 | +最大延迟: 0.6659秒 | |
| 104 | +P50延迟: 0.1123秒 | |
| 105 | +P95延迟: 0.5845秒 | |
| 106 | +P99延迟: 0.6210秒 | |
| 107 | +标准差: 0.1877秒 | |
| 108 | +QPS: 4.76 请求/秒 | |
| 109 | +============================================================ | |
| 110 | + | |
| 111 | +开始顺序测试模型: Qwen3-Embedding-0.6B | |
| 112 | +测试次数: 1000 | |
| 113 | + 已完成 100/1000 次请求... | |
| 114 | + | |
| 115 | + 已完成 200/1000 次请求... | |
| 116 | + 已完成 300/1000 次请求... | |
| 117 | + 已完成 400/1000 次请求... | |
| 118 | + 已完成 500/1000 次请求... | |
| 119 | + 已完成 600/1000 次请求... | |
| 120 | + 已完成 700/1000 次请求... | |
| 121 | + 已完成 800/1000 次请求... | |
| 122 | + 已完成 900/1000 次请求... | |
| 123 | + | |
| 124 | +============================================================ | |
| 125 | +性能测试结果 - Qwen3-Embedding-0.6B | |
| 126 | +============================================================ | |
| 127 | +总请求数: 1000 | |
| 128 | +成功请求: 1000 | |
| 129 | +失败请求: 0 | |
| 130 | +成功率: 100.00% | |
| 131 | +总耗时: 109.9795秒 | |
| 132 | +平均延迟: 0.1100秒 | |
| 133 | +最小延迟: 0.0571秒 | |
| 134 | +最大延迟: 0.5806秒 | |
| 135 | +P50延迟: 0.0600秒 | |
| 136 | +P95延迟: 0.5648秒 | |
| 137 | +P99延迟: 0.5745秒 | |
| 138 | +标准差: 0.1494秒 | |
| 139 | +QPS: 9.09 请求/秒 | |
| 140 | +============================================================ | |
| 141 | + | |
| 142 | +结果已保存到: performance_results.json | |
| 143 | + | |
| 144 | +============================================================ | |
| 145 | +性能测试汇总对比 | |
| 146 | +============================================================ | |
| 147 | + | |
| 148 | +模型: bge-m3 (concurrent) | |
| 149 | + QPS: 4.70 | |
| 150 | + 平均延迟: 0.2129秒 | |
| 151 | + 成功率: 100.00% | |
| 152 | + | |
| 153 | +模型: bge-m3 (sequential) | |
| 154 | + QPS: 12.23 | |
| 155 | + 平均延迟: 0.0818秒 | |
| 156 | + 成功率: 100.00% | |
| 157 | + | |
| 158 | +模型: Qwen3-Embedding-0.6B (concurrent) | |
| 159 | + QPS: 4.76 | |
| 160 | + 平均延迟: 0.2102秒 | |
| 161 | + 成功率: 100.00% | |
| 162 | + | |
| 163 | +模型: Qwen3-Embedding-0.6B (sequential) | |
| 164 | + QPS: 9.09 | |
| 165 | + 平均延迟: 0.1100秒 | |
| 166 | + 成功率: 100.00% | ... | ... |