diff --git a/README.md b/README.md index 59b7577..5ceb717 100644 --- a/README.md +++ b/README.md @@ -2,6 +2,50 @@ # TODO 多语言: 语义: +多语言: +1. dis_max的方式 +"query" : { + "dis_max" : { + "queries" : [ + {"match" : { "title_en" : xxx }}, + {"match" : { "title_zh" : xxx }}, + {"match" : { "title_xx" : xxx }} + ], + "tie_breakler" : 0.8 + } +} + + + +"corss_field": +"multi_match" : { + "query" : + "fields" : [...], + "type": "cross_fields", + "operator" : "and" +} + + +支持英文的拼写接错: +title: multi_field +"query" : { + "query_string" : { + "query": "xxx", + "default_field": "title.ngram", + "minimum_should_match": "85%" + } +} + + + +业务提权: +rescore: window_size query_weight rescore_query_weight + +function_score: +boost +以及 可以把每个子查询用function_score包一下 + + query anchor diff --git a/docs/常用查询 - ES.md b/docs/常用查询 - ES.md index 04a9644..e2f4f23 100644 --- a/docs/常用查询 - ES.md +++ b/docs/常用查询 - ES.md @@ -5,6 +5,21 @@ # ====================================== ### 1. 根据 tenant_id / spu_id 查询 +curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products_tenant_170/_search?pretty' -H 'Content-Type: application/json' -d '{ +{ + "size": 11, + "_source": "*", + "query": { + "bool": { + "filter": [ + { "term": {"spu_id" : 206150} }, + { "term": { "tenant_id": "170" } } + ] + } + } + }' + + curl -u 'essa:4hOaLaf41y2VuI8y' -X GET 'http://localhost:9200/search_products/_search?pretty' -H 'Content-Type: application/json' -d '{ "size": 100, "_source": ["title_zh", "title_en"], diff --git a/third-party/xinference/测试结果-perfermance_test.txt b/third-party/xinference/测试结果-perfermance_test.txt index e69de29..ef43a66 100644 --- a/third-party/xinference/测试结果-perfermance_test.txt +++ b/third-party/xinference/测试结果-perfermance_test.txt @@ -0,0 +1,166 @@ +============================================================ +Embedding API 性能测试 +============================================================ + +选择测试模式: +1. 顺序测试 (Sequential) +2. 并发测试 (Concurrent) +3. 两种模式都测试 +请输入选择 (1/2/3, 默认1): 3 + +============================================================ +测试模型: bge-m3 +============================================================ + +开始并发测试模型: bge-m3 +测试次数: 1000, 并发数: 10 + 已完成 100/1000 次请求... + 已完成 200/1000 次请求... + 已完成 300/1000 次请求... + 已完成 400/1000 次请求... + 已完成 500/1000 次请求... + 已完成 600/1000 次请求... + 已完成 700/1000 次请求... + 已完成 800/1000 次请求... + 已完成 900/1000 次请求... + 已完成 1000/1000 次请求... + +============================================================ +性能测试结果 - bge-m3 +============================================================ +总请求数: 1000 +成功请求: 1000 +失败请求: 0 +成功率: 100.00% +总耗时: 212.9068秒 +平均延迟: 0.2129秒 +最小延迟: 0.0507秒 +最大延迟: 0.6196秒 +P50延迟: 0.0942秒 +P95延迟: 0.5580秒 +P99延迟: 0.5884秒 +标准差: 0.2010秒 +QPS: 4.70 请求/秒 +============================================================ + +开始顺序测试模型: bge-m3 +测试次数: 1000 + 已完成 100/1000 次请求... + 已完成 200/1000 次请求... + 已完成 300/1000 次请求... + 已完成 400/1000 次请求... + 已完成 500/1000 次请求... + 已完成 600/1000 次请求... + 已完成 700/1000 次请求... + 已完成 800/1000 次请求... + 已完成 900/1000 次请求... + +============================================================ +性能测试结果 - bge-m3 +============================================================ +总请求数: 1000 +成功请求: 1000 +失败请求: 0 +成功率: 100.00% +总耗时: 81.7646秒 +平均延迟: 0.0818秒 +最小延迟: 0.0328秒 +最大延迟: 0.5812秒 +P50延迟: 0.0347秒 +P95延迟: 0.4893秒 +P99延迟: 0.5047秒 +标准差: 0.1377秒 +QPS: 12.23 请求/秒 +============================================================ + +============================================================ +测试模型: Qwen3-Embedding-0.6B +============================================================ + +开始并发测试模型: Qwen3-Embedding-0.6B +测试次数: 1000, 并发数: 10 + 已完成 100/1000 次请求... + 已完成 200/1000 次请求... + 已完成 300/1000 次请求... + 已完成 400/1000 次请求... + 已完成 500/1000 次请求... + 已完成 600/1000 次请求... + 已完成 700/1000 次请求... + 已完成 800/1000 次请求... + 已完成 900/1000 次请求... + 已完成 1000/1000 次请求... + +============================================================ +性能测试结果 - Qwen3-Embedding-0.6B +============================================================ +总请求数: 1000 +成功请求: 1000 +失败请求: 0 +成功率: 100.00% +总耗时: 210.1917秒 +平均延迟: 0.2102秒 +最小延迟: 0.0651秒 +最大延迟: 0.6659秒 +P50延迟: 0.1123秒 +P95延迟: 0.5845秒 +P99延迟: 0.6210秒 +标准差: 0.1877秒 +QPS: 4.76 请求/秒 +============================================================ + +开始顺序测试模型: Qwen3-Embedding-0.6B +测试次数: 1000 + 已完成 100/1000 次请求... + + 已完成 200/1000 次请求... + 已完成 300/1000 次请求... + 已完成 400/1000 次请求... + 已完成 500/1000 次请求... + 已完成 600/1000 次请求... + 已完成 700/1000 次请求... + 已完成 800/1000 次请求... + 已完成 900/1000 次请求... + +============================================================ +性能测试结果 - Qwen3-Embedding-0.6B +============================================================ +总请求数: 1000 +成功请求: 1000 +失败请求: 0 +成功率: 100.00% +总耗时: 109.9795秒 +平均延迟: 0.1100秒 +最小延迟: 0.0571秒 +最大延迟: 0.5806秒 +P50延迟: 0.0600秒 +P95延迟: 0.5648秒 +P99延迟: 0.5745秒 +标准差: 0.1494秒 +QPS: 9.09 请求/秒 +============================================================ + +结果已保存到: performance_results.json + +============================================================ +性能测试汇总对比 +============================================================ + +模型: bge-m3 (concurrent) + QPS: 4.70 + 平均延迟: 0.2129秒 + 成功率: 100.00% + +模型: bge-m3 (sequential) + QPS: 12.23 + 平均延迟: 0.0818秒 + 成功率: 100.00% + +模型: Qwen3-Embedding-0.6B (concurrent) + QPS: 4.76 + 平均延迟: 0.2102秒 + 成功率: 100.00% + +模型: Qwen3-Embedding-0.6B (sequential) + QPS: 9.09 + 平均延迟: 0.1100秒 + 成功率: 100.00% -- libgit2 0.21.2