Commit 472cca0cf678e716c641c723bbb1af1857453998

Authored by tangwang
1 parent 72e7256a

doc

README.md
... ... @@ -2,6 +2,50 @@
2 2 # TODO
3 3 多语言:
4 4 语义:
  5 +多语言:
  6 +1. dis_max的方式
  7 +"query" : {
  8 + "dis_max" : {
  9 + "queries" : [
  10 + {"match" : { "title_en" : xxx }},
  11 + {"match" : { "title_zh" : xxx }},
  12 + {"match" : { "title_xx" : xxx }}
  13 + ],
  14 + "tie_breakler" : 0.8
  15 + }
  16 +}
  17 +
  18 +
  19 +
  20 +"corss_field":
  21 +"multi_match" : {
  22 + "query" :
  23 + "fields" : [...],
  24 + "type": "cross_fields",
  25 + "operator" : "and"
  26 +}
  27 +
  28 +
  29 +支持英文的拼写接错:
  30 +title: multi_field
  31 +"query" : {
  32 + "query_string" : {
  33 + "query": "xxx",
  34 + "default_field": "title.ngram",
  35 + "minimum_should_match": "85%"
  36 + }
  37 +}
  38 +
  39 +
  40 +
  41 +业务提权:
  42 +rescore: window_size query_weight rescore_query_weight
  43 +
  44 +function_score:
  45 +boost
  46 +以及 可以把每个子查询用function_score包一下
  47 +
  48 +
5 49  
6 50  
7 51 query anchor
... ...
docs/常用查询 - ES.md
... ... @@ -5,6 +5,21 @@
5 5 # ======================================
6 6  
7 7 ### 1. 根据 tenant_id / spu_id 查询
  8 +curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products_tenant_170/_search?pretty' -H 'Content-Type: application/json' -d '{
  9 +{
  10 + "size": 11,
  11 + "_source": "*",
  12 + "query": {
  13 + "bool": {
  14 + "filter": [
  15 + { "term": {"spu_id" : 206150} },
  16 + { "term": { "tenant_id": "170" } }
  17 + ]
  18 + }
  19 + }
  20 + }'
  21 +
  22 +
8 23 curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products/_search?pretty' -H 'Content-Type: application/json' -d '{
9 24 "size": 100,
10 25 "_source": ["title_zh", "title_en"],
... ...
third-party/xinference/测试结果-perfermance_test.txt
... ... @@ -0,0 +1,166 @@
  1 +============================================================
  2 +Embedding API 性能测试
  3 +============================================================
  4 +
  5 +选择测试模式:
  6 +1. 顺序测试 (Sequential)
  7 +2. 并发测试 (Concurrent)
  8 +3. 两种模式都测试
  9 +请输入选择 (1/2/3, 默认1): 3
  10 +
  11 +============================================================
  12 +测试模型: bge-m3
  13 +============================================================
  14 +
  15 +开始并发测试模型: bge-m3
  16 +测试次数: 1000, 并发数: 10
  17 + 已完成 100/1000 次请求...
  18 + 已完成 200/1000 次请求...
  19 + 已完成 300/1000 次请求...
  20 + 已完成 400/1000 次请求...
  21 + 已完成 500/1000 次请求...
  22 + 已完成 600/1000 次请求...
  23 + 已完成 700/1000 次请求...
  24 + 已完成 800/1000 次请求...
  25 + 已完成 900/1000 次请求...
  26 + 已完成 1000/1000 次请求...
  27 +
  28 +============================================================
  29 +性能测试结果 - bge-m3
  30 +============================================================
  31 +总请求数: 1000
  32 +成功请求: 1000
  33 +失败请求: 0
  34 +成功率: 100.00%
  35 +总耗时: 212.9068秒
  36 +平均延迟: 0.2129秒
  37 +最小延迟: 0.0507秒
  38 +最大延迟: 0.6196秒
  39 +P50延迟: 0.0942秒
  40 +P95延迟: 0.5580秒
  41 +P99延迟: 0.5884秒
  42 +标准差: 0.2010秒
  43 +QPS: 4.70 请求/秒
  44 +============================================================
  45 +
  46 +开始顺序测试模型: bge-m3
  47 +测试次数: 1000
  48 + 已完成 100/1000 次请求...
  49 + 已完成 200/1000 次请求...
  50 + 已完成 300/1000 次请求...
  51 + 已完成 400/1000 次请求...
  52 + 已完成 500/1000 次请求...
  53 + 已完成 600/1000 次请求...
  54 + 已完成 700/1000 次请求...
  55 + 已完成 800/1000 次请求...
  56 + 已完成 900/1000 次请求...
  57 +
  58 +============================================================
  59 +性能测试结果 - bge-m3
  60 +============================================================
  61 +总请求数: 1000
  62 +成功请求: 1000
  63 +失败请求: 0
  64 +成功率: 100.00%
  65 +总耗时: 81.7646秒
  66 +平均延迟: 0.0818秒
  67 +最小延迟: 0.0328秒
  68 +最大延迟: 0.5812秒
  69 +P50延迟: 0.0347秒
  70 +P95延迟: 0.4893秒
  71 +P99延迟: 0.5047秒
  72 +标准差: 0.1377秒
  73 +QPS: 12.23 请求/秒
  74 +============================================================
  75 +
  76 +============================================================
  77 +测试模型: Qwen3-Embedding-0.6B
  78 +============================================================
  79 +
  80 +开始并发测试模型: Qwen3-Embedding-0.6B
  81 +测试次数: 1000, 并发数: 10
  82 + 已完成 100/1000 次请求...
  83 + 已完成 200/1000 次请求...
  84 + 已完成 300/1000 次请求...
  85 + 已完成 400/1000 次请求...
  86 + 已完成 500/1000 次请求...
  87 + 已完成 600/1000 次请求...
  88 + 已完成 700/1000 次请求...
  89 + 已完成 800/1000 次请求...
  90 + 已完成 900/1000 次请求...
  91 + 已完成 1000/1000 次请求...
  92 +
  93 +============================================================
  94 +性能测试结果 - Qwen3-Embedding-0.6B
  95 +============================================================
  96 +总请求数: 1000
  97 +成功请求: 1000
  98 +失败请求: 0
  99 +成功率: 100.00%
  100 +总耗时: 210.1917秒
  101 +平均延迟: 0.2102秒
  102 +最小延迟: 0.0651秒
  103 +最大延迟: 0.6659秒
  104 +P50延迟: 0.1123秒
  105 +P95延迟: 0.5845秒
  106 +P99延迟: 0.6210秒
  107 +标准差: 0.1877秒
  108 +QPS: 4.76 请求/秒
  109 +============================================================
  110 +
  111 +开始顺序测试模型: Qwen3-Embedding-0.6B
  112 +测试次数: 1000
  113 + 已完成 100/1000 次请求...
  114 +
  115 + 已完成 200/1000 次请求...
  116 + 已完成 300/1000 次请求...
  117 + 已完成 400/1000 次请求...
  118 + 已完成 500/1000 次请求...
  119 + 已完成 600/1000 次请求...
  120 + 已完成 700/1000 次请求...
  121 + 已完成 800/1000 次请求...
  122 + 已完成 900/1000 次请求...
  123 +
  124 +============================================================
  125 +性能测试结果 - Qwen3-Embedding-0.6B
  126 +============================================================
  127 +总请求数: 1000
  128 +成功请求: 1000
  129 +失败请求: 0
  130 +成功率: 100.00%
  131 +总耗时: 109.9795秒
  132 +平均延迟: 0.1100秒
  133 +最小延迟: 0.0571秒
  134 +最大延迟: 0.5806秒
  135 +P50延迟: 0.0600秒
  136 +P95延迟: 0.5648秒
  137 +P99延迟: 0.5745秒
  138 +标准差: 0.1494秒
  139 +QPS: 9.09 请求/秒
  140 +============================================================
  141 +
  142 +结果已保存到: performance_results.json
  143 +
  144 +============================================================
  145 +性能测试汇总对比
  146 +============================================================
  147 +
  148 +模型: bge-m3 (concurrent)
  149 + QPS: 4.70
  150 + 平均延迟: 0.2129秒
  151 + 成功率: 100.00%
  152 +
  153 +模型: bge-m3 (sequential)
  154 + QPS: 12.23
  155 + 平均延迟: 0.0818秒
  156 + 成功率: 100.00%
  157 +
  158 +模型: Qwen3-Embedding-0.6B (concurrent)
  159 + QPS: 4.76
  160 + 平均延迟: 0.2102秒
  161 + 成功率: 100.00%
  162 +
  163 +模型: Qwen3-Embedding-0.6B (sequential)
  164 + QPS: 9.09
  165 + 平均延迟: 0.1100秒
  166 + 成功率: 100.00%
... ...