漏斗参数调优&呈现优化

tangwang
1 parent 16d28bf8
Showing 16 changed files with 765 additions and 101 deletions Show diff stats
config/config.yaml
config/env_config.py
config/loader.py
config/schema.py
config/services_config.py
docs/issue-2026-03-27-添加粗排精排-第2轮-done-0327.txt
docs/issue-2026-03-27-添加粗排精排-第一轮-done-0327.txt
frontend/static/js/app.js
reranker/README.md
reranker/config.py
reranker/server.py
scripts/lib/reranker_backend_env.sh
scripts/service_ctl.sh
scripts/start_reranker.sh
search/searcher.py
tests/test_search_rerank_window.py
@@ -421,19 +421,31 @@ services:
         normalize_embeddings: true
   rerank:
     provider: "http"
-    base_url: "http://127.0.0.1:6007"
     providers:
       http:
-        base_url: "http://127.0.0.1:6007"
-        service_url: "http://127.0.0.1:6007/rerank"
-        service_urls:
-          default: "http://127.0.0.1:6007/rerank"
-          fine: "http://127.0.0.1:6009/rerank"
+        instances:
+          default:
+            base_url: "http://127.0.0.1:6007"
+            service_url: "http://127.0.0.1:6007/rerank"
+          fine:
+            base_url: "http://127.0.0.1:6009"
+            service_url: "http://127.0.0.1:6009/rerank"
     request:
       max_docs: 1000
       normalize: true
-    # 服务内后端（reranker 进程启动时读取）
-    backend: "qwen3_vllm_score"  # bge | jina_reranker_v3 | qwen3_vllm | qwen3_vllm_score | qwen3_transformers | qwen3_transformers_packed | qwen3_gguf | qwen3_gguf_06b | dashscope_rerank
+    default_instance: "default"
+    # 命名实例：同一套 reranker 代码按实例名读取不同端口 / 后端 / runtime 目录。
+    instances:
+      default:
+        host: "0.0.0.0"
+        port: 6007
+        backend: "qwen3_vllm_score"
+        runtime_dir: "./.runtime/reranker/default"
+      fine:
+        host: "0.0.0.0"
+        port: 6009
+        backend: "bge"
+        runtime_dir: "./.runtime/reranker/fine"
     backends:
       bge:
         model_name: "BAAI/bge-reranker-v2-m3"
@@ -10,6 +10,7 @@ from __future__ import annotations
 from typing import Any, Dict
  
 from config.loader import get_app_config
+from config.services_config import get_rerank_service_url
  
  
 def _app():
@@ -92,10 +93,7 @@ INDEXER_BASE_URL = (
 )
 EMBEDDING_TEXT_SERVICE_URL = _app().services.embedding.get_provider_config().get("text_base_url")
 EMBEDDING_IMAGE_SERVICE_URL = _app().services.embedding.get_provider_config().get("image_base_url")
-RERANKER_SERVICE_URL = (
-    _app().services.rerank.get_provider_config().get("service_url")
-    or _app().services.rerank.get_provider_config().get("base_url")
-)
+RERANKER_SERVICE_URL = get_rerank_service_url()
  
  
 def get_es_config() -> Dict[str, Any]:
@@ -43,6 +43,7 @@ from config.schema import (
     RerankConfig,
     RerankFusionConfig,
     RerankServiceConfig,
+    RerankServiceInstanceConfig,
     RuntimeConfig,
     SearchConfig,
     SecretsConfig,
@@ -615,13 +616,61 @@ class AppConfigLoader:
         rerank_providers = dict(rerank_raw.get("providers") or {})
         if rerank_provider not in rerank_providers:
             raise ConfigurationError(f"services.rerank.providers.{rerank_provider} must be configured")
-        rerank_backend = str(rerank_raw.get("backend") or "").strip().lower()
         rerank_backends = {
             str(key).strip().lower(): dict(value)
             for key, value in dict(rerank_raw.get("backends") or {}).items()
         }
-        if rerank_backend not in rerank_backends:
-            raise ConfigurationError(f"services.rerank.backends.{rerank_backend} must be configured")
+        default_instance = str(rerank_raw.get("default_instance") or "default").strip() or "default"
+        raw_instances = rerank_raw.get("instances") if isinstance(rerank_raw.get("instances"), dict) else {}
+        if not raw_instances:
+            legacy_backend = str(rerank_raw.get("backend") or "").strip().lower()
+            if legacy_backend not in rerank_backends:
+                raise ConfigurationError(f"services.rerank.backends.{legacy_backend} must be configured")
+            provider_cfg = dict(rerank_providers.get(rerank_provider) or {})
+            raw_instances = {
+                default_instance: {
+                    "host": "0.0.0.0",
+                    "port": 6007,
+                    "backend": legacy_backend,
+                    "base_url": provider_cfg.get("base_url"),
+                    "service_url": provider_cfg.get("service_url"),
+                }
+            }
+        rerank_instances = {}
+        for instance_name, instance_raw in raw_instances.items():
+            if not isinstance(instance_raw, dict):
+                raise ConfigurationError(f"services.rerank.instances.{instance_name} must be a mapping")
+            normalized_instance_name = str(instance_name).strip()
+            backend_name = str(instance_raw.get("backend") or "").strip().lower()
+            if backend_name not in rerank_backends:
+                raise ConfigurationError(
+                    f"services.rerank.instances.{normalized_instance_name}.backend must reference configured services.rerank.backends"
+                )
+            port = int(instance_raw.get("port", 6007))
+            rerank_instances[normalized_instance_name] = RerankServiceInstanceConfig(
+                host=str(instance_raw.get("host") or "0.0.0.0"),
+                port=port,
+                backend=backend_name,
+                runtime_dir=(
+                    str(v)
+                    if (v := instance_raw.get("runtime_dir")) not in (None, "")
+                    else None
+                ),
+                base_url=(
+                    str(v).rstrip("/")
+                    if (v := instance_raw.get("base_url")) not in (None, "")
+                    else None
+                ),
+                service_url=(
+                    str(v).rstrip("/")
+                    if (v := instance_raw.get("service_url")) not in (None, "")
+                    else None
+                ),
+            )
+        if default_instance not in rerank_instances:
+            raise ConfigurationError(
+                f"services.rerank.default_instance={default_instance!r} must exist in services.rerank.instances"
+            )
         rerank_request = dict(rerank_raw.get("request") or {})
         rerank_request.setdefault("max_docs", 1000)
         rerank_request.setdefault("normalize", True)
@@ -629,7 +678,8 @@ class AppConfigLoader:
         rerank_config = RerankServiceConfig(
             provider=rerank_provider,
             providers=rerank_providers,
-            backend=rerank_backend,
+            default_instance=default_instance,
+            instances=rerank_instances,
             backends=rerank_backends,
             request=rerank_request,
         )
@@ -754,8 +804,19 @@ class AppConfigLoader:
             errors.append("services.embedding.providers.<provider>.image_base_url is required")
  
         rerank_provider_cfg = app_config.services.rerank.get_provider_config()
-        if not rerank_provider_cfg.get("service_url") and not rerank_provider_cfg.get("base_url"):
-            errors.append("services.rerank.providers.<provider>.service_url or base_url is required")
+        provider_instances = rerank_provider_cfg.get("instances")
+        if not isinstance(provider_instances, dict):
+            provider_instances = {}
+        for instance_name in app_config.services.rerank.instances:
+            instance_cfg = app_config.services.rerank.get_instance(instance_name)
+            provider_instance_cfg = provider_instances.get(instance_name) if isinstance(provider_instances, dict) else None
+            has_instance_url = False
+            if isinstance(provider_instance_cfg, dict):
+                has_instance_url = bool(provider_instance_cfg.get("service_url") or provider_instance_cfg.get("base_url"))
+            if not has_instance_url and not instance_cfg.service_url and not instance_cfg.base_url:
+                errors.append(
+                    f"services.rerank instance {instance_name!r} must define service_url/base_url either under providers.<provider>.instances or services.rerank.instances"
+                )
  
         if errors:
             raise ConfigurationError("Configuration validation failed:\n" + "\n".join(f"  - {err}" for err in errors))
@@ -236,20 +236,41 @@ class EmbeddingServiceConfig:
  
  
 @dataclass(frozen=True)
+class RerankServiceInstanceConfig:
+    """One named reranker service instance."""
+
+    host: str = "0.0.0.0"
+    port: int = 6007
+    backend: str = "qwen3_vllm_score"
+    runtime_dir: Optional[str] = None
+    base_url: Optional[str] = None
+    service_url: Optional[str] = None
+
+
+@dataclass(frozen=True)
 class RerankServiceConfig:
     """Reranker service configuration."""
  
     provider: str
     providers: Dict[str, Any]
-    backend: str
+    default_instance: str
+    instances: Dict[str, RerankServiceInstanceConfig]
     backends: Dict[str, Dict[str, Any]]
     request: Dict[str, Any]
  
     def get_provider_config(self) -> Dict[str, Any]:
         return dict(self.providers.get(self.provider, {}) or {})
  
-    def get_backend_config(self) -> Dict[str, Any]:
-        return dict(self.backends.get(self.backend, {}) or {})
+    def get_instance(self, name: Optional[str] = None) -> RerankServiceInstanceConfig:
+        instance_name = str(name or self.default_instance).strip() or self.default_instance
+        instance = self.instances.get(instance_name)
+        if instance is None:
+            raise KeyError(f"Unknown rerank service instance: {instance_name!r}")
+        return instance
+
+    def get_backend_config(self, name: Optional[str] = None) -> Dict[str, Any]:
+        instance = self.get_instance(name)
+        return dict(self.backends.get(instance.backend, {}) or {})
  
  
 @dataclass(frozen=True)
@@ -11,7 +11,12 @@ import os
 from typing import Any, Dict, Tuple
  
 from config.loader import get_app_config
-from config.schema import EmbeddingServiceConfig, RerankServiceConfig, TranslationServiceConfig
+from config.schema import (
+    EmbeddingServiceConfig,
+    RerankServiceConfig,
+    RerankServiceInstanceConfig,
+    TranslationServiceConfig,
+)
  
  
 def get_translation_config() -> Dict[str, Any]:
@@ -26,6 +31,16 @@ def get_rerank_config() -&gt; RerankServiceConfig:
     return get_app_config().services.rerank
  
  
+def get_rerank_instance_config(profile: str | None = None) -> RerankServiceInstanceConfig:
+    cfg = get_app_config().services.rerank
+    instance_name = str(
+        profile
+        or os.getenv("RERANK_INSTANCE")
+        or cfg.default_instance
+    ).strip() or cfg.default_instance
+    return cfg.get_instance(instance_name)
+
+
 def get_translation_base_url() -> str:
     return get_app_config().services.translation.endpoint
  
@@ -60,31 +75,56 @@ def get_embedding_image_backend_config() -&gt; Tuple[str, Dict[str, Any]]:
     return cfg.image_backend, cfg.get_image_backend_config()
  
  
-def get_rerank_backend_config() -> Tuple[str, Dict[str, Any]]:
+def get_rerank_backend_config(profile: str | None = None) -> Tuple[str, Dict[str, Any]]:
     cfg = get_app_config().services.rerank
-    backend = str(os.getenv("RERANK_BACKEND") or cfg.backend).strip()
-    if backend != cfg.backend:
+    instance = get_rerank_instance_config(profile)
+    backend = str(os.getenv("RERANK_BACKEND") or instance.backend).strip()
+    if backend != instance.backend:
         backend_cfg = cfg.backends.get(backend)
         if backend_cfg is None:
             raise ValueError(f"Unknown rerank backend override from RERANK_BACKEND: {backend!r}")
         return backend, dict(backend_cfg)
-    return cfg.backend, cfg.get_backend_config()
+    return instance.backend, cfg.get_backend_config(profile)
  
  
 def get_rerank_base_url(profile: str | None = None) -> str:
-    provider_cfg = get_app_config().services.rerank.get_provider_config()
+    cfg = get_app_config().services.rerank
+    instance = get_rerank_instance_config(profile)
+    provider_cfg = cfg.get_provider_config()
+    profile_name = str(profile or os.getenv("RERANK_INSTANCE") or cfg.default_instance).strip() or cfg.default_instance
+
     base = None
-    profile_name = str(profile).strip() if profile else ""
-    if profile_name:
-        service_urls = provider_cfg.get("service_urls")
-        if isinstance(service_urls, dict):
-            base = service_urls.get(profile_name)
+    provider_instances = provider_cfg.get("instances")
+    if isinstance(provider_instances, dict):
+        instance_provider_cfg = provider_instances.get(profile_name)
+        if isinstance(instance_provider_cfg, dict):
+            base = instance_provider_cfg.get("base_url") or instance_provider_cfg.get("service_url")
+    if not base:
+        base = instance.base_url or instance.service_url
     if not base:
         base = provider_cfg.get("service_url") or provider_cfg.get("base_url")
     if not base:
         raise ValueError("Rerank service URL is not configured")
-    return str(base).rstrip("/")
+    base = str(base).rstrip("/")
+    if base.endswith("/rerank"):
+        base = base[: -len("/rerank")]
+    return base
  
  
 def get_rerank_service_url(profile: str | None = None) -> str:
-    return get_rerank_base_url(profile=profile)
+    cfg = get_app_config().services.rerank
+    instance = get_rerank_instance_config(profile)
+    provider_cfg = cfg.get_provider_config()
+    profile_name = str(profile or os.getenv("RERANK_INSTANCE") or cfg.default_instance).strip() or cfg.default_instance
+
+    service_url = None
+    provider_instances = provider_cfg.get("instances")
+    if isinstance(provider_instances, dict):
+        instance_provider_cfg = provider_instances.get(profile_name)
+        if isinstance(instance_provider_cfg, dict):
+            service_url = instance_provider_cfg.get("service_url")
+    if not service_url:
+        service_url = instance.service_url
+    if not service_url:
+        service_url = f"{get_rerank_base_url(profile=profile)}/rerank"
+    return str(service_url).rstrip("/")
@@ -0,0 +1,38 @@
+这是上一轮检索效果优化的需求：
+参考
+searcher.py 
+rerank_client.py 
+schema.py 
+es_query_builder.py 
+config.yaml 
+相关性检索优化说明.md 
+
+在ES返回到rerank期间增加一轮粗排+一轮精排。
+1. ES召回，600
+2. 粗排：600->240。配置文件增加粗排相关配置，包括输入条数（配置为700，ES拉取的条数改为粗排输入条数），然后增加粗排的融合公式配置，参考现有的reranker融合公式即可、只是去掉其中的重排模型项。
+3. 现在的sku选择、为reranker生成title后缀这一套逻辑，是放在粗排后，因为精排也是一个reranker模型（只不过是一个轻量级的，bge-reranker），需要用这个title后缀。
+4. 精排：240-80，使用bge-reranker，但是，因为reranker只能选一个backend，考虑如何重构。现在，精排也是一个独立的进程、独立提供端口，服务。但是，因为跟重排逻辑是一致的（即使有部分不一致也应该分离不一致的点进行配置化），所以共用代码，只是根据需要启动两个实例，避免代码冗余。
+5. 重排：80，也是用当前的重排代码，调用单独的实例（即现在使用的实例），返回后，经过融合公式，到分页，也参考现在的融合公式，但是，加入一项精排模型打分。
+测试时，使用跟我同样的环境./scripts/service_ctl.sh reranker backend 重启相关服务进行测试
+
+你已经完成了一般修改，已把三段排序链路接上了，主改动在 search/searcher.py、search/rerank_client.py、config/schema.py、config/loader.py、config/services_config.py 和 config/config.yaml。
+
+现在链路是：
+ES 拉取 coarse_rank.input_window 条 -> 粗排按 text/knn 融合裁到 coarse_rank.output_window -> 再做 SKU 选择和 title suffix -> 精排调用轻量 reranker 裁到 fine_rank.output_window -> 最终重排调用现有 reranker，并在最终融合里加入 fine_score。同时把 reranker client/provider 改成了按 service_profile 选不同 service_url，这样 fine/final 可以共用同一套服务代码，只起不同实例。
+
+你是用了./.venv/bin/pytest -q tests/test_rerank_client.py tests/test_search_rerank_window.py 进行验证，结果是 18 passed。也按要求尝试了 ./scripts/service_ctl.sh restart reranker backend 做联调，但当前环境里只有 6007 的现有 reranker，配置里的 fine 端口 6009 还没对应实例，而且服务重启后进程状态不太稳定，没能完成完整线上链路验证。当前最关键的落地前置是把轻量 bge 实例补起来，再用同样脚本重启联调。
+
+因此，需要回顾这个漏斗的代码，进行进一步的优化：
+1. Fine Rank环节的信息都是N/A。fine 实例也需要在config.yaml中体现，并且需要被server_ctl.sh管理，参考现在是怎么管理reranker的。fine和reranker分别调用哪个模型（两者代码功能，但是只是启动不同的实例），请你深度思考后决定。这里是需要参考当前代码、根据实际需要（原来只有一个reranker、现在多了一个精排，也要调用一个重排模型，因此带来的必要的部分重构。
+2. Ranking Funnel、Fusion Factors、Signal Breakdown
+这些是不是整合起来、按漏斗收集、整理信息、以及进行呈现比较好。
+ES 召回的环节，展示Matched Queries各项打分、ES的总分、norm后打分、排序位置，等等关键信息
+粗排：粗排融合公式的各项输入、重要中间结果和参数、最后得分，排序位置以及上升/下降了多少。等等关键信息。
+精排：同样例举关键的输入、中间过程、输出、排序和位置变化等。
+reranker：类似
+
+因为涉及的环节较多，非常要注意的一个点是：不要每次修改都在原来的基础上，为实现目标而打补丁，应该观察一下所涉及的代码现在是怎么做的，务必注意如何适当的清理掉现有逻辑，该如何对其进行修改，来达到目的，以达到代码的精简，避免冗余、分叉。
+特别是1关于将现在的单独的reranker服务，在不增加代码复杂度的情况下，如何可以通过配置启动多个实例、各自可以配置选择的模型等相关参数、分别服务于精排和重排，是设计的重中之重。这里需要思考配置如何拆分，需要多读相关代码、思考最佳实践。
+
+
+
@@ -0,0 +1,136 @@
+我：
+进行一轮检索效果优化：
+参考
+[searcher.py](search/searcher.py) 
+[rerank_client.py](search/rerank_client.py) 
+[schema.py](config/schema.py) 
+[es_query_builder.py](search/es_query_builder.py) 
+[config.yaml](config/config.yaml) 
+[相关性检索优化说明.md](docs/相关性检索优化说明.md) 
+
+在ES返回到rerank期间增加一轮粗排+一轮精排。
+1. ES召回，600
+2. 粗排：600->240。配置文件增加粗排相关配置，包括输入条数（配置为700，ES拉取的条数改为粗排输入条数），然后增加粗排的融合公式配置，参考现有的reranker融合公式即可、只是去掉其中的重排模型项。
+3. 现在的sku选择、为reranker生成title后缀这一套逻辑，是放在粗排后，因为精排也是一个reranker模型（只不过是一个轻量级的，bge-reranker），需要用这个title后缀。
+4. 精排：240-80，使用bge-reranker，但是，因为reranker只能选一个backend，考虑如何重构。现在，精排也是一个独立的进程、独立提供端口，服务。但是，因为跟重排逻辑是一致的（即使有部分不一致也应该分离不一致的点进行配置化），所以共用代码，只是根据需要启动两个实例，避免代码冗余。
+5. 重排：80，也是用当前的重排代码，调用单独的实例（即现在使用的实例），返回后，经过融合公式，到分页，也参考现在的融合公式，但是，加入一项精排模型打分。
+测试时，使用跟我同样的环境./scripts/service_ctl.sh reranker backend 重启相关服务进行测试
+
+
+
+
+
+codex：
+前端这轮我把调试展示重构成了“两层漏斗”：
+
+1. 整体漏斗
+在 [frontend/static/js/app.js](/data/saas-search/frontend/static/js/app.js) 里把原来散着的 `Query Analysis / Rerank / Stage Timings / ES Query` 重新组织成了：
+- `Query Context`
+- `Ranking Funnel`
+- `Timing Breakdown`
+- `Raw Payloads`
+
+其中 `Ranking Funnel` 现在按阶段卡片展示：
+- `ES Recall`
+- `Coarse Rank`
+- `Fine Rank`
+- `Final Rerank`
+- `Page Return`
+
+每张卡都尽量只放调参最关键的信息：输入/输出条数、模板、service URL、top_n、fusion/meta。这样你看漏斗收缩、看每段服务表现、看融合参数会更直接。
+
+2. 单条结果漏斗
+在结果卡片右侧的 debug 区，我改成了真正的单条漏斗卡片，按“分数结果”和“公式分解”分开看：
+- 顶部先看 `Initial Rank / Final Rank / Rank Delta`
+- 再看阶段分数：`ES / ES Norm / Coarse / Fine / Rerank / Fused`
+- 再看融合因子：`coarse_text_factor / coarse_knn_factor / text_factor / knn_factor / fine_factor / rerank_factor`
+- 再看信号拆解：`text_source / text_translation / text_primary / text_support / text_knn / image_knn`
+
+同时保留了可展开的：
+- `Rerank Input`
+- `Selected SKU`
+- `Matched Queries`
+- `Multilingual Fields`
+
+为了支撑前端，我顺手在 [search/searcher.py](/data/saas-search/search/searcher.py) 里补了单条 `coarse_score / coarse_text_factor / coarse_knn_factor` 到 `per_result`，这样单条卡片现在能把粗排也完整展示出来。
+
+样式上在 [frontend/static/css/style.css](/data/saas-search/frontend/static/css/style.css) 加了阶段卡片、分数 pill、时延条形图和移动端适配。JS 语法我用 `node --check frontend/static/js/app.js` 过了，后端补充字段也用 `./.venv/bin/python -m py_compile search/searcher.py` 过了。
+
+如果你愿意，我下一步可以继续把这个视图再往“调参工作台”方向推一层，比如再加：
+- 漏斗阶段间的 drop rate
+- 每条结果的 rank jump 高亮
+- 批量对比 top N 结果里某个因子分布
+- fusion 参数和结果联动的可视化摘要
+
+
+
+
+
+
+
+
+我：
+1. Fine Rank环节的信息都是N/A，是没有配置吗。fine rank是使用bge-reranker，复用当前reranker模型的代码，但是需要单独起一个服务、单独加载一个模型。
+2. Ranking Funnel、Fusion Factors、Signal Breakdown
+这些是不是整合起来、按漏斗收集、整理信息、以及进行呈现比较好。
+ES 召回的环节，展示Matched Queries各项打分、ES的总分、norm后打分、排序位置，等等关键信息
+粗排：粗排融合公式的各项输入、重要中间结果和参数、最后得分，排序位置以及上升/下降了多少。等等关键信息。
+精排：同样例举关键的输入、中间过程、输出、排序和位置变化等。
+reranker：类似
+
+因为涉及的环节较多，非常要注意的一个点是：不要每次修改都在原来的基础上，为实现目标而打补丁，应该观察一下所涉及的代码现在是怎么做的，务必注意如何适当的清理掉现有逻辑，该如何对其进行修改，来达到目的，以达到代码的精简，避免冗余、分叉。
+
+
+
+
+
+
+codex：
+`Fine Rank` 之前显示 `N/A`，根因不是前端单纯没写，而是后端原来只有“精排成功拿到分数”时才会填那块 debug；一旦 `fine` 服务没起、没配 `service_url`、调用失败，前端只能看到空值。现在我把这层补齐了：
+
+- 顶层 `debug_info.fine_rank` 现在会始终带 `status / service_profile / service_url / input_window / output_window / query_template / doc_template`
+- 失败时会带 `error`
+- 成功时再补 `docs / top_n / meta`
+- 所以你现在能区分：
+  - `disabled`
+  - `pending`
+  - `ok`
+  - `failed_no_scores`
+  - `failed`
+
+也就是说，`fine rank` 本身仍然需要你按设计单独起一个 `bge-reranker` 实例，这一层代码已经按“独立服务 + 共用 reranker 代码”的方式接好了，但服务本身还是要单独启动。
+
+这轮我也把调试展示做了结构化重构，不再继续在旧视图上打补丁。现在是按阶段组织信息：
+
+- 整体漏斗：
+  - `ES Recall`
+  - `Coarse Rank`
+  - `Fine Rank`
+  - `Final Rerank`
+  - `Page Return`
+- 单条结果：
+  - 用统一的 `ranking_funnel` 结构来表达每个阶段的
+  - `rank`
+  - `delta`
+  - `score`
+  - 关键中间量
+  - 关键 factor
+  - 输入 payload
+
+具体改动在：
+- [search/searcher.py](/data/saas-search/search/searcher.py)
+- [frontend/static/js/app.js](/data/saas-search/frontend/static/js/app.js)
+- [frontend/static/css/style.css](/data/saas-search/frontend/static/css/style.css)
+
+单条结果现在按 stage card 展示，而不是把 `Ranking Funnel / Fusion Factors / Signal Breakdown` 拆成三块平铺，这样你可以顺着 ES -> 粗排 -> 精排 -> rerank 看每段的输入、过程、输出和位次变化，更适合调融合公式。
+
+检查我也跑过了：
+- `node --check frontend/static/js/app.js`
+- `./.venv/bin/python -m py_compile search/searcher.py`
+- `./.venv/bin/pytest -q tests/test_search_rerank_window.py`
+
+都通过了。
+
+下一步如果你要，我建议直接继续做两件事中的一个：
+1. 把 `fine` 实例真正拉起来，然后我再把前端里 `status=failed/pending` 的场景跑成真实数据。
+2. 在当前漏斗视图上继续加“阶段 rank 分布 / delta 高亮 / topN 因子对比”，把它做成更像调参工作台。
 \ No newline at end of file
@@ -498,6 +498,12 @@ function renderJsonDetails(title, payload, open = false) {
 function buildProductDebugHtml({ debug, result, spuId, tenantId }) {
     const resultJson = customStringify(result);
     const rawUrl = `${API_BASE_URL}/search/es-doc/${encodeURIComponent(spuId)}?tenant_id=${encodeURIComponent(tenantId)}`;
+    const funnel = debug.ranking_funnel || {};
+    const esStage = funnel.es_recall || {};
+    const coarseStage = funnel.coarse_rank || {};
+    const fineStage = funnel.fine_rank || {};
+    const rerankStage = funnel.rerank || {};
+    const finalPageStage = funnel.final_page || {};
  
     const rankSummary = renderMetricList([
         { label: 'Initial Rank', value: debug.initial_rank ?? 'N/A' },
@@ -507,33 +513,57 @@ function buildProductDebugHtml({ debug, result, spuId, tenantId }) {
     ]);
  
     const stageScores = renderScorePills([
-        { label: 'ES', value: formatDebugNumber(debug.es_score), tone: 'tone-es' },
-        { label: 'ES Norm', value: formatDebugNumber(debug.es_score_normalized), tone: 'tone-neutral' },
-        { label: 'Coarse', value: formatDebugNumber(debug.coarse_score), tone: 'tone-coarse' },
-        { label: 'Fine', value: formatDebugNumber(debug.fine_score), tone: 'tone-fine' },
-        { label: 'Rerank', value: formatDebugNumber(debug.rerank_score), tone: 'tone-rerank' },
-        { label: 'Fused', value: formatDebugNumber(debug.fused_score), tone: 'tone-final' },
+        { label: 'ES', value: formatDebugNumber(esStage.score ?? debug.es_score), tone: 'tone-es' },
+        { label: 'ES Norm', value: formatDebugNumber(esStage.normalized_score ?? debug.es_score_normalized), tone: 'tone-neutral' },
+        { label: 'Coarse', value: formatDebugNumber(coarseStage.score ?? debug.coarse_score), tone: 'tone-coarse' },
+        { label: 'Fine', value: formatDebugNumber(fineStage.score ?? debug.fine_score), tone: 'tone-fine' },
+        { label: 'Rerank', value: formatDebugNumber(rerankStage.rerank_score ?? debug.rerank_score), tone: 'tone-rerank' },
+        { label: 'Fused', value: formatDebugNumber(rerankStage.fused_score ?? debug.fused_score), tone: 'tone-final' },
     ]);
  
-    const factorMetrics = renderMetricList([
-        { label: 'coarse_text_factor', value: formatDebugNumber(debug.coarse_text_factor) },
-        { label: 'coarse_knn_factor', value: formatDebugNumber(debug.coarse_knn_factor) },
-        { label: 'text_factor', value: formatDebugNumber(debug.text_factor) },
-        { label: 'knn_factor', value: formatDebugNumber(debug.knn_factor) },
-        { label: 'fine_factor', value: formatDebugNumber(debug.fine_factor) },
-        { label: 'rerank_factor', value: formatDebugNumber(debug.rerank_factor) },
-    ]);
-
-    const signalMetrics = renderMetricList([
-        { label: 'text_score', value: formatDebugNumber(debug.text_score) },
-        { label: 'text_source', value: formatDebugNumber(debug.text_source_score) },
-        { label: 'text_translation', value: formatDebugNumber(debug.text_translation_score) },
-        { label: 'text_primary', value: formatDebugNumber(debug.text_primary_score) },
-        { label: 'text_support', value: formatDebugNumber(debug.text_support_score) },
-        { label: 'knn_score', value: formatDebugNumber(debug.knn_score) },
-        { label: 'text_knn', value: formatDebugNumber(debug.text_knn_score) },
-        { label: 'image_knn', value: formatDebugNumber(debug.image_knn_score) },
-    ]);
+    const stageGrid = `
+        <div class="debug-stage-grid">
+            ${buildStageCard('ES Recall', 'Matched queries and ES raw score', [
+                { label: 'rank', value: esStage.rank ?? debug.initial_rank ?? 'N/A' },
+                { label: 'es_score', value: formatDebugNumber(esStage.score ?? debug.es_score) },
+                { label: 'es_norm', value: formatDebugNumber(esStage.normalized_score ?? debug.es_score_normalized) },
+            ], renderJsonDetails('Matched Queries', esStage.matched_queries ?? debug.matched_queries, false))}
+            ${buildStageCard('Coarse Rank', 'Text + vector fusion', [
+                { label: 'rank', value: coarseStage.rank ?? 'N/A' },
+                { label: 'rank_change', value: coarseStage.rank_change ?? 'N/A' },
+                { label: 'coarse_score', value: formatDebugNumber(coarseStage.score ?? debug.coarse_score) },
+                { label: 'text_score', value: formatDebugNumber(coarseStage.text_score ?? debug.text_score) },
+                { label: 'text_source', value: formatDebugNumber(coarseStage.signals?.text_source_score ?? debug.text_source_score) },
+                { label: 'text_translation', value: formatDebugNumber(coarseStage.signals?.text_translation_score ?? debug.text_translation_score) },
+                { label: 'text_primary', value: formatDebugNumber(coarseStage.signals?.text_primary_score ?? debug.text_primary_score) },
+                { label: 'text_support', value: formatDebugNumber(coarseStage.signals?.text_support_score ?? debug.text_support_score) },
+                { label: 'knn_score', value: formatDebugNumber(coarseStage.knn_score ?? debug.knn_score) },
+                { label: 'text_knn', value: formatDebugNumber(coarseStage.signals?.text_knn_score ?? debug.text_knn_score) },
+                { label: 'image_knn', value: formatDebugNumber(coarseStage.signals?.image_knn_score ?? debug.image_knn_score) },
+                { label: 'text_factor', value: formatDebugNumber(coarseStage.text_factor ?? debug.coarse_text_factor) },
+                { label: 'knn_factor', value: formatDebugNumber(coarseStage.knn_factor ?? debug.coarse_knn_factor) },
+            ], renderJsonDetails('Coarse Signals', coarseStage.signals, false))}
+            ${buildStageCard('Fine Rank', 'Lightweight reranker output', [
+                { label: 'rank', value: fineStage.rank ?? 'N/A' },
+                { label: 'rank_change', value: fineStage.rank_change ?? 'N/A' },
+                { label: 'fine_score', value: formatDebugNumber(fineStage.score ?? debug.fine_score) },
+            ], renderJsonDetails('Fine Input', fineStage.rerank_input ?? debug.rerank_input, false))}
+            ${buildStageCard('Final Rerank', 'Heavy reranker + final fusion', [
+                { label: 'rank', value: rerankStage.rank ?? finalPageStage.rank ?? debug.final_rank ?? 'N/A' },
+                { label: 'rank_change', value: rerankStage.rank_change ?? finalPageStage.rank_change ?? 'N/A' },
+                { label: 'rerank_score', value: formatDebugNumber(rerankStage.rerank_score ?? debug.rerank_score) },
+                { label: 'text_score', value: formatDebugNumber(rerankStage.text_score ?? debug.text_score) },
+                { label: 'knn_score', value: formatDebugNumber(rerankStage.knn_score ?? debug.knn_score) },
+                { label: 'text_source', value: formatDebugNumber(rerankStage.signals?.text_source_score ?? debug.text_source_score) },
+                { label: 'text_translation', value: formatDebugNumber(rerankStage.signals?.text_translation_score ?? debug.text_translation_score) },
+                { label: 'fine_factor', value: formatDebugNumber(rerankStage.fine_factor ?? debug.fine_factor) },
+                { label: 'rerank_factor', value: formatDebugNumber(rerankStage.rerank_factor ?? debug.rerank_factor) },
+                { label: 'text_factor', value: formatDebugNumber(rerankStage.text_factor ?? debug.text_factor) },
+                { label: 'knn_factor', value: formatDebugNumber(rerankStage.knn_factor ?? debug.knn_factor) },
+                { label: 'fused_score', value: formatDebugNumber(rerankStage.fused_score ?? debug.fused_score) },
+            ], renderJsonDetails('Rerank Signals', rerankStage.signals, false))}
+        </div>
+    `;
  
     const titlePayload = {};
     if (debug.title_multilingual) titlePayload.title = debug.title_multilingual;
@@ -545,13 +575,8 @@ function buildProductDebugHtml({ debug, result, spuId, tenantId }) {
             <div class="product-debug-title">Ranking Funnel</div>
             ${rankSummary}
             ${stageScores}
-            <div class="product-debug-subtitle">Fusion Factors</div>
-            ${factorMetrics}
-            <div class="product-debug-subtitle">Signal Breakdown</div>
-            ${signalMetrics}
-            ${renderJsonDetails('Rerank Input', debug.rerank_input, true)}
+            ${stageGrid}
             ${renderJsonDetails('Selected SKU', debug.style_intent_sku, true)}
-            ${renderJsonDetails('Matched Queries', debug.matched_queries, false)}
             ${renderJsonDetails('Multilingual Fields', titlePayload, false)}
             <div class="product-debug-actions">
                 <button type="button" class="product-debug-inline-result-btn"
@@ -1019,9 +1044,10 @@ function buildGlobalFunnelHtml(data, debugInfo) {
     const featureFlags = debugInfo.feature_flags || {};
     const esResponse = debugInfo.es_response || {};
     const esQueryContext = debugInfo.es_query_context || {};
-    const coarseInfo = debugInfo.coarse_rank || {};
-    const fineInfo = debugInfo.fine_rank || {};
-    const rerankInfo = debugInfo.rerank || {};
+    const rankingFunnel = debugInfo.ranking_funnel || {};
+    const coarseInfo = rankingFunnel.coarse_rank || debugInfo.coarse_rank || {};
+    const fineInfo = rankingFunnel.fine_rank || debugInfo.fine_rank || {};
+    const rerankInfo = rankingFunnel.rerank || debugInfo.rerank || {};
     const translations = queryAnalysis.translations || {};
  
     const summaryHtml = `
@@ -1060,14 +1086,20 @@ function buildGlobalFunnelHtml(data, debugInfo) {
                 ], coarseInfo.fusion ? renderJsonDetails('Coarse Fusion', coarseInfo.fusion, false) : '')}
                 ${buildStageCard('Fine Rank', 'Lightweight reranker', [
                     { label: 'service_url', value: fineInfo.service_url || 'N/A' },
-                    { label: 'docs', value: fineInfo.docs ?? fineInfo.top_n ?? 'N/A' },
+                    { label: 'docs_in', value: fineInfo.docs_in ?? 'N/A' },
+                    { label: 'docs_out', value: fineInfo.docs_out ?? fineInfo.top_n ?? 'N/A' },
                     { label: 'top_n', value: fineInfo.top_n ?? 'N/A' },
+                    { label: 'backend', value: fineInfo.backend || 'N/A' },
+                    { label: 'model', value: fineInfo.model || fineInfo.backend_model_name || 'N/A' },
                     { label: 'query_template', value: fineInfo.query_template || 'N/A' },
                 ], fineInfo.meta ? renderJsonDetails('Fine Meta', fineInfo.meta, false) : '')}
                 ${buildStageCard('Final Rerank', 'Heavy reranker + final fusion', [
                     { label: 'service_url', value: rerankInfo.service_url || 'N/A' },
-                    { label: 'docs', value: rerankInfo.docs ?? 'N/A' },
+                    { label: 'docs_in', value: rerankInfo.docs_in ?? 'N/A' },
+                    { label: 'docs_out', value: rerankInfo.docs_out ?? 'N/A' },
                     { label: 'top_n', value: rerankInfo.top_n ?? 'N/A' },
+                    { label: 'backend', value: rerankInfo.backend || 'N/A' },
+                    { label: 'model', value: rerankInfo.model || rerankInfo.backend_model_name || 'N/A' },
                     { label: 'query_template', value: rerankInfo.query_template || 'N/A' },
                 ], `${rerankInfo.fusion ? renderJsonDetails('Final Fusion', rerankInfo.fusion, false) : ''}${rerankInfo.meta ? renderJsonDetails('Rerank Meta', rerankInfo.meta, false) : ''}`)}
                 ${buildStageCard('Page Return', 'Final slice returned to UI', [
@@ -71,7 +71,7 @@ Reranker 服务提供统一的 `/rerank` API，支持可插拔后端（BGE、Jin
 - `qwen3_transformers_packed` -> `.venv-reranker-transformers-packed`
 - `qwen3_gguf` -> `.venv-reranker-gguf`
 - `qwen3_gguf_06b` -> `.venv-reranker-gguf-06b`
-- `bge` -> `.venv-reranker-bge`
+- `bge` -> `.venv-reranker`
 - `dashscope_rerank` -> `.venv-reranker-dashscope`
  
  
@@ -2,19 +2,29 @@
  
 from __future__ import annotations
  
+import os
+
 from config.loader import get_app_config
  
  
 class RerankerConfig(object):
     def __init__(self) -> None:
         app_config = get_app_config()
-        runtime = app_config.runtime
         service = app_config.services.rerank
-        backend = service.get_backend_config()
+        instance_name = str(os.getenv("RERANK_INSTANCE") or service.default_instance).strip() or service.default_instance
+        instance = service.get_instance(instance_name)
+        backend = service.get_backend_config(instance_name)
         request = service.request
  
-        self.HOST = runtime.reranker_host
-        self.PORT = runtime.reranker_port
+        self.INSTANCE = instance_name
+        self.HOST = str(os.getenv("RERANKER_HOST") or instance.host)
+        self.PORT = int(os.getenv("RERANKER_PORT") or instance.port)
+        self.BACKEND = str(os.getenv("RERANK_BACKEND") or instance.backend)
+        self.RUNTIME_DIR = str(
+            os.getenv("RERANKER_RUNTIME_DIR")
+            or instance.runtime_dir
+            or f"./.runtime/reranker/{instance_name}"
+        )
  
         self.MODEL_NAME = str(backend.get("model_name") or "Qwen/Qwen3-Reranker-0.6B")
         self.DEVICE = backend.get("device")
@@ -6,7 +6,7 @@ POST /rerank
 Request: { "query": "...", "docs": ["doc1", "doc2", ...], "normalize": optional bool }
 Response: { "scores": [float], "meta": {...} }
  
-Backend selected via config: services.rerank.backend
+Backend selected via config: services.rerank.instances.<name>.backend
 (bge | jina_reranker_v3 | qwen3_vllm | qwen3_vllm_score | qwen3_transformers | qwen3_transformers_packed | qwen3_gguf | qwen3_gguf_06b | dashscope_rerank), env RERANK_BACKEND.
 """
  
@@ -76,14 +76,15 @@ class RerankResponse(BaseModel):
 @app.on_event("startup")
 def load_model() -> None:
     global _reranker, _backend_name
-    logger.info("Starting reranker service on port %s", CONFIG.PORT)
+    logger.info("Starting reranker service | instance=%s port=%s", CONFIG.INSTANCE, CONFIG.PORT)
     try:
-        backend_name, backend_cfg = get_rerank_backend_config()
+        backend_name, backend_cfg = get_rerank_backend_config(CONFIG.INSTANCE)
         _backend_name = backend_name
         _reranker = get_rerank_backend(backend_name, backend_cfg)
         model_info = getattr(_reranker, "_model_name", None) or backend_cfg.get("model_name", backend_name)
         logger.info(
-            "Reranker ready | backend=%s model=%s",
+            "Reranker ready | instance=%s backend=%s model=%s",
+            CONFIG.INSTANCE,
             _backend_name,
             model_info,
         )
@@ -101,6 +102,7 @@ def health() -&gt; Dict[str, Any]:
         ).get("model_name", _backend_name)
     payload: Dict[str, Any] = {
         "status": "ok" if _reranker is not None else "unavailable",
+        "instance": CONFIG.INSTANCE,
         "model_loaded": _reranker is not None,
         "model": model_info,
         "backend": _backend_name,
@@ -45,7 +45,7 @@ reranker_backend_venv_dir() {
     qwen3_gguf_06b) printf '%s/.venv-reranker-gguf-06b\n' "${project_root}" ;;
     qwen3_transformers) printf '%s/.venv-reranker-transformers\n' "${project_root}" ;;
     qwen3_transformers_packed) printf '%s/.venv-reranker-transformers-packed\n' "${project_root}" ;;
-    bge) printf '%s/.venv-reranker-bge\n' "${project_root}" ;;
+    bge) printf '%s/.venv-reranker\n' "${project_root}" ;;
     dashscope_rerank) printf '%s/.venv-reranker-dashscope\n' "${project_root}" ;;
     *) printf '%s/.venv-reranker-%s\n' "${project_root}" "${backend}" ;;
   esac
@@ -16,14 +16,45 @@ mkdir -p &quot;${LOG_DIR}&quot;
 source "${PROJECT_ROOT}/scripts/lib/load_env.sh"
  
 CORE_SERVICES=("backend" "indexer" "frontend")
-OPTIONAL_SERVICES=("tei" "cnclip" "embedding" "embedding-image" "translator" "reranker")
+OPTIONAL_SERVICES=("tei" "cnclip" "embedding" "embedding-image" "translator" "reranker" "reranker-fine")
 FULL_SERVICES=("${OPTIONAL_SERVICES[@]}" "${CORE_SERVICES[@]}")
-STOP_ORDER_SERVICES=("frontend" "indexer" "backend" "reranker" "translator" "embedding-image" "embedding" "cnclip" "tei")
+STOP_ORDER_SERVICES=("frontend" "indexer" "backend" "reranker-fine" "reranker" "translator" "embedding-image" "embedding" "cnclip" "tei")
  
 all_services() {
   echo "${FULL_SERVICES[@]}"
 }
  
+config_python_bin() {
+  if [ -x "${PROJECT_ROOT}/.venv/bin/python" ]; then
+    echo "${PROJECT_ROOT}/.venv/bin/python"
+  else
+    echo "${PYTHON:-python3}"
+  fi
+}
+
+reranker_instance_for_service() {
+  local service="$1"
+  case "${service}" in
+    reranker) echo "default" ;;
+    reranker-fine) echo "fine" ;;
+    *) echo "" ;;
+  esac
+}
+
+get_reranker_instance_port() {
+  local instance="$1"
+  local pybin
+  pybin="$(config_python_bin)"
+  RERANK_INSTANCE="${instance}" PYTHONPATH="${PROJECT_ROOT}${PYTHONPATH:+:${PYTHONPATH}}" "${pybin}" - <<'PY'
+from config.loader import get_app_config
+import os
+
+cfg = get_app_config().services.rerank
+name = (os.getenv("RERANK_INSTANCE") or cfg.default_instance).strip() or cfg.default_instance
+print(cfg.get_instance(name).port)
+PY
+}
+
 get_port() {
   local service="$1"
   case "${service}" in
@@ -33,7 +64,20 @@ get_port() {
     embedding) echo "${EMBEDDING_TEXT_PORT:-6005}" ;;
     embedding-image) echo "${EMBEDDING_IMAGE_PORT:-6008}" ;;
     translator) echo "${TRANSLATION_PORT:-6006}" ;;
-    reranker) echo "${RERANKER_PORT:-6007}" ;;
+    reranker)
+      if [ -n "${RERANKER_PORT:-}" ]; then
+        echo "${RERANKER_PORT}"
+      else
+        get_reranker_instance_port "default"
+      fi
+      ;;
+    reranker-fine)
+      if [ -n "${RERANKER_FINE_PORT:-}" ]; then
+        echo "${RERANKER_FINE_PORT}"
+      else
+        get_reranker_instance_port "fine"
+      fi
+      ;;
     tei) echo "${TEI_PORT:-8080}" ;;
     cnclip) echo "${CNCLIP_PORT:-51000}" ;;
     *) echo "" ;;
@@ -70,6 +114,7 @@ service_start_cmd() {
     embedding-image) echo "./scripts/start_embedding_image_service.sh" ;;
     translator) echo "./scripts/start_translator.sh" ;;
     reranker) echo "./scripts/start_reranker.sh" ;;
+    reranker-fine) echo "./scripts/start_reranker.sh" ;;
     tei) echo "./scripts/start_tei_service.sh" ;;
     cnclip) echo "./scripts/start_cnclip_service.sh" ;;
     *) return 1 ;;
@@ -79,7 +124,7 @@ service_start_cmd() {
 service_exists() {
   local service="$1"
   case "${service}" in
-    backend|indexer|frontend|embedding|embedding-image|translator|reranker|tei|cnclip) return 0 ;;
+    backend|indexer|frontend|embedding|embedding-image|translator|reranker|reranker-fine|tei|cnclip) return 0 ;;
     *) return 1 ;;
   esac
 }
@@ -97,7 +142,7 @@ validate_targets() {
 health_path_for_service() {
   local service="$1"
   case "${service}" in
-    backend|indexer|embedding|embedding-image|translator|reranker|tei) echo "/health" ;;
+    backend|indexer|embedding|embedding-image|translator|reranker|reranker-fine|tei) echo "/health" ;;
     *) echo "" ;;
   esac
 }
@@ -505,7 +550,7 @@ get_cnclip_flow_device() {
 start_health_retries_for_service() {
   local service="$1"
   case "${service}" in
-    reranker) echo 90 ;;
+    reranker|reranker-fine) echo 90 ;;
     *) echo 30 ;;
   esac
 }
@@ -593,9 +638,15 @@ start_one() {
         return 1
       fi
       ;;
-    backend|indexer|frontend|embedding|embedding-image|translator|reranker)
+    backend|indexer|frontend|embedding|embedding-image|translator|reranker|reranker-fine)
       echo "[start] ${service}"
-      nohup "${cmd}" >> "${lf}" 2>&1 &
+      local rerank_instance=""
+      rerank_instance="$(reranker_instance_for_service "${service}")"
+      if [ -n "${rerank_instance}" ]; then
+        nohup env RERANK_INSTANCE="${rerank_instance}" "${cmd}" >> "${lf}" 2>&1 &
+      else
+        nohup "${cmd}" >> "${lf}" 2>&1 &
+      fi
       local pid=$!
       echo "${pid}" > "${pf}"
       wait_for_startup_health "${service}" "${pid}" "${lf}"
@@ -673,7 +724,7 @@ stop_one() {
     fi
   fi
  
-  if [ "${service}" = "reranker" ]; then
+  if [[ "${service}" == reranker* ]] && ! service_is_running "reranker" && ! service_is_running "reranker-fine"; then
     cleanup_reranker_orphans
   fi
 }
@@ -871,7 +922,7 @@ Special targets:
  
 Examples:
   ./scripts/service_ctl.sh up all
-  ./scripts/service_ctl.sh up tei cnclip embedding embedding-image translator reranker
+  ./scripts/service_ctl.sh up tei cnclip embedding embedding-image translator reranker reranker-fine
   ./scripts/service_ctl.sh up backend indexer frontend
   ./scripts/service_ctl.sh restart
   ./scripts/service_ctl.sh monitor-start all
@@ -14,9 +14,31 @@ load_env_file &quot;${PROJECT_ROOT}/.env&quot;
 # shellcheck source=scripts/lib/reranker_backend_env.sh
 source "${PROJECT_ROOT}/scripts/lib/reranker_backend_env.sh"
  
-RERANKER_HOST="${RERANKER_HOST:-0.0.0.0}"
-RERANKER_PORT="${RERANKER_PORT:-6007}"
-RERANK_BACKEND="${RERANK_BACKEND:-$(detect_rerank_backend "${PROJECT_ROOT}")}"
+CONFIG_PYTHON="${PROJECT_ROOT}/.venv/bin/python"
+if [[ ! -x "${CONFIG_PYTHON}" ]]; then
+  CONFIG_PYTHON="${PYTHON:-python3}"
+fi
+
+RERANK_INSTANCE="${RERANK_INSTANCE:-default}"
+
+read -r INSTANCE_HOST INSTANCE_PORT INSTANCE_BACKEND INSTANCE_RUNTIME_DIR <<EOF
+$(
+  PYTHONPATH="${PROJECT_ROOT}${PYTHONPATH:+:${PYTHONPATH}}" "${CONFIG_PYTHON}" - <<'PY'
+from config.loader import get_app_config
+import os
+
+cfg = get_app_config().services.rerank
+name = (os.getenv("RERANK_INSTANCE") or cfg.default_instance).strip() or cfg.default_instance
+instance = cfg.get_instance(name)
+runtime_dir = instance.runtime_dir or f"./.runtime/reranker/{name}"
+print(instance.host, instance.port, instance.backend, runtime_dir)
+PY
+)
+EOF
+
+RERANKER_HOST="${RERANKER_HOST:-${INSTANCE_HOST:-0.0.0.0}}"
+RERANKER_PORT="${RERANKER_PORT:-${INSTANCE_PORT:-6007}}"
+RERANK_BACKEND="${RERANK_BACKEND:-${INSTANCE_BACKEND:-$(detect_rerank_backend "${PROJECT_ROOT}")}}"
 RERANKER_VENV="${RERANKER_VENV:-$(reranker_backend_venv_dir "${PROJECT_ROOT}" "${RERANK_BACKEND}")}"
 PYTHON_BIN="${RERANKER_VENV}/bin/python"
  
@@ -27,7 +49,10 @@ if [[ ! -x &quot;${PYTHON_BIN}&quot; ]]; then
 fi
  
 # Keep vLLM/triton/torch caches out of system disk.
-RERANKER_RUNTIME_DIR="${RERANKER_RUNTIME_DIR:-${PROJECT_ROOT}/.runtime/reranker}"
+RERANKER_RUNTIME_DIR="${RERANKER_RUNTIME_DIR:-${INSTANCE_RUNTIME_DIR:-${PROJECT_ROOT}/.runtime/reranker/${RERANK_INSTANCE}}}"
+if [[ "${RERANKER_RUNTIME_DIR}" != /* ]]; then
+  RERANKER_RUNTIME_DIR="${PROJECT_ROOT}/${RERANKER_RUNTIME_DIR#./}"
+fi
 mkdir -p "${RERANKER_RUNTIME_DIR}/home" \
          "${RERANKER_RUNTIME_DIR}/cache" \
          "${RERANKER_RUNTIME_DIR}/config" \
@@ -102,6 +127,7 @@ fi
 echo "========================================"
 echo "Starting Reranker Service"
 echo "========================================"
+echo "Instance: ${RERANK_INSTANCE}"
 echo "Python: ${PYTHON_BIN}"
 echo "Host: ${RERANKER_HOST}"
 echo "Port: ${RERANKER_PORT}"
@@ -373,6 +373,9 @@ class Searcher:
  
         es_score_normalization_factor: Optional[float] = None
         initial_ranks_by_doc: Dict[str, int] = {}
+        coarse_ranks_by_doc: Dict[str, int] = {}
+        fine_ranks_by_doc: Dict[str, int] = {}
+        rerank_ranks_by_doc: Dict[str, int] = {}
         coarse_debug_info: Optional[Dict[str, Any]] = None
         fine_debug_info: Optional[Dict[str, Any]] = None
         rerank_debug_info: Optional[Dict[str, Any]] = None
@@ -626,7 +629,7 @@ class Searcher:
         style_intent_decisions: Dict[str, SkuSelectionDecision] = {}
         if do_rerank and in_rerank_window:
             from dataclasses import asdict
-            from config.services_config import get_rerank_service_url
+            from config.services_config import get_rerank_backend_config, get_rerank_service_url
             from .rerank_client import coarse_resort_hits, run_lightweight_rerank, run_rerank
  
             rerank_query = parsed_query.text_for_rerank() if parsed_query else query
@@ -642,11 +645,17 @@ class Searcher:
                 hits = hits[:coarse_output_window]
                 es_response.setdefault("hits", {})["hits"] = hits
                 if debug:
-                    coarse_debug_info = {
-                        "docs_in": es_fetch_size,
-                        "docs_out": len(hits),
-                        "fusion": asdict(coarse_cfg.fusion),
+                    coarse_ranks_by_doc = {
+                        str(hit.get("_id")): rank
+                        for rank, hit in enumerate(hits, 1)
+                        if hit.get("_id") is not None
                     }
+                    if debug:
+                        coarse_debug_info = {
+                            "docs_in": es_fetch_size,
+                            "docs_out": len(hits),
+                            "fusion": asdict(coarse_cfg.fusion),
+                        }
                     context.store_intermediate_result("coarse_rank_scores", coarse_debug)
                 context.logger.info(
                     "粗排完成 | docs_in=%s | docs_out=%s",
@@ -717,12 +726,23 @@ class Searcher:
                         hits = hits[:fine_output_window]
                         es_response["hits"]["hits"] = hits
                         if debug:
+                            fine_ranks_by_doc = {
+                                str(hit.get("_id")): rank
+                                for rank, hit in enumerate(hits, 1)
+                                if hit.get("_id") is not None
+                            }
+                            fine_backend_name, fine_backend_cfg = get_rerank_backend_config(fine_cfg.service_profile)
                             fine_debug_info = {
+                                "service_profile": fine_cfg.service_profile,
                                 "service_url": get_rerank_service_url(profile=fine_cfg.service_profile),
+                                "backend": fine_backend_name,
+                                "model": fine_meta.get("model") if isinstance(fine_meta, dict) else None,
+                                "backend_model_name": fine_backend_cfg.get("model_name"),
                                 "query_template": fine_query_template,
                                 "doc_template": fine_doc_template,
                                 "query_text": str(fine_query_template).format_map({"query": rerank_query}),
-                                "docs": len(hits),
+                                "docs_in": min(len(fine_scores), fine_input_window),
+                                "docs_out": len(hits),
                                 "top_n": fine_output_window,
                                 "meta": fine_meta,
                             }
@@ -768,12 +788,23 @@ class Searcher:
  
                 if rerank_meta is not None:
                     if debug:
+                        rerank_ranks_by_doc = {
+                            str(hit.get("_id")): rank
+                            for rank, hit in enumerate(es_response.get("hits", {}).get("hits") or [], 1)
+                            if hit.get("_id") is not None
+                        }
+                        rerank_backend_name, rerank_backend_cfg = get_rerank_backend_config(rc.service_profile)
                         rerank_debug_info = {
+                            "service_profile": rc.service_profile,
                             "service_url": get_rerank_service_url(profile=rc.service_profile),
+                            "backend": rerank_backend_name,
+                            "model": rerank_meta.get("model") if isinstance(rerank_meta, dict) else None,
+                            "backend_model_name": rerank_backend_cfg.get("model_name"),
                             "query_template": effective_query_template,
                             "doc_template": effective_doc_template,
                             "query_text": str(effective_query_template).format_map({"query": rerank_query}),
-                            "docs": len(es_response.get("hits", {}).get("hits") or []),
+                            "docs_in": len(final_input),
+                            "docs_out": len(es_response.get("hits", {}).get("hits") or []),
                             "top_n": from_ + size,
                             "meta": rerank_meta,
                             "fusion": asdict(rc.fusion),
@@ -1019,6 +1050,60 @@ class Searcher:
                         debug_entry["fine_score"] = fine_debug.get("fine_score")
                         debug_entry["rerank_input"] = fine_debug.get("rerank_input")
  
+                    initial_rank = initial_ranks_by_doc.get(str(doc_id)) if doc_id is not None else None
+                    coarse_rank = coarse_ranks_by_doc.get(str(doc_id)) if doc_id is not None else None
+                    fine_rank = fine_ranks_by_doc.get(str(doc_id)) if doc_id is not None else None
+                    rerank_rank = rerank_ranks_by_doc.get(str(doc_id)) if doc_id is not None else None
+                    final_rank = final_ranks_by_doc.get(str(doc_id)) if doc_id is not None else None
+
+                    def _rank_change(previous_rank: Optional[int], current_rank: Optional[int]) -> Optional[int]:
+                        if previous_rank is None or current_rank is None:
+                            return None
+                        return previous_rank - current_rank
+
+                    debug_entry["ranking_funnel"] = {
+                        "es_recall": {
+                            "rank": initial_rank,
+                            "score": es_score,
+                            "normalized_score": normalized,
+                            "matched_queries": hit.get("matched_queries"),
+                        },
+                        "coarse_rank": {
+                            "rank": coarse_rank,
+                            "rank_change": _rank_change(initial_rank, coarse_rank),
+                            "score": coarse_debug.get("coarse_score") if coarse_debug else None,
+                            "text_score": coarse_debug.get("text_score") if coarse_debug else None,
+                            "knn_score": coarse_debug.get("knn_score") if coarse_debug else None,
+                            "text_factor": coarse_debug.get("coarse_text_factor") if coarse_debug else None,
+                            "knn_factor": coarse_debug.get("coarse_knn_factor") if coarse_debug else None,
+                            "signals": coarse_debug,
+                        },
+                        "fine_rank": {
+                            "rank": fine_rank,
+                            "rank_change": _rank_change(coarse_rank, fine_rank),
+                            "score": fine_debug.get("fine_score") if fine_debug else hit.get("_fine_score"),
+                            "rerank_input": fine_debug.get("rerank_input") if fine_debug else None,
+                        },
+                        "rerank": {
+                            "rank": rerank_rank,
+                            "rank_change": _rank_change(fine_rank, rerank_rank),
+                            "rerank_score": rerank_debug.get("rerank_score") if rerank_debug else hit.get("_rerank_score"),
+                            "fine_score": rerank_debug.get("fine_score") if rerank_debug else hit.get("_fine_score"),
+                            "fused_score": rerank_debug.get("fused_score") if rerank_debug else hit.get("_fused_score"),
+                            "text_score": rerank_debug.get("text_score") if rerank_debug else hit.get("_text_score"),
+                            "knn_score": rerank_debug.get("knn_score") if rerank_debug else hit.get("_knn_score"),
+                            "rerank_factor": rerank_debug.get("rerank_factor") if rerank_debug else None,
+                            "fine_factor": rerank_debug.get("fine_factor") if rerank_debug else None,
+                            "text_factor": rerank_debug.get("text_factor") if rerank_debug else None,
+                            "knn_factor": rerank_debug.get("knn_factor") if rerank_debug else None,
+                            "signals": rerank_debug,
+                        },
+                        "final_page": {
+                            "rank": final_rank,
+                            "rank_change": _rank_change(rerank_rank, final_rank),
+                        },
+                    }
+
                     if style_intent_debug:
                         debug_entry["style_intent_sku"] = style_intent_debug
  
@@ -1091,6 +1176,15 @@ class Searcher:
                 "coarse_rank": coarse_debug_info,
                 "fine_rank": fine_debug_info,
                 "rerank": rerank_debug_info,
+                "ranking_funnel": {
+                    "es_recall": {
+                        "docs_out": es_fetch_size,
+                        "score_normalization_factor": es_score_normalization_factor,
+                    },
+                    "coarse_rank": coarse_debug_info,
+                    "fine_rank": fine_debug_info,
+                    "rerank": rerank_debug_info,
+                },
                 "feature_flags": context.metadata.get('feature_flags', {}),
                 "stage_timings": {
                     k: round(v, 2) for k, v in context.performance_metrics.stage_timings.items()
@@ -299,6 +299,73 @@ def test_config_loader_rerank_enabled_defaults_true(tmp_path: Path):
     assert loaded.rerank.enabled is True
  
  
+def test_config_loader_parses_named_rerank_instances(tmp_path: Path):
+    from config.loader import AppConfigLoader
+
+    config_data = {
+        "es_index_name": "test_products",
+        "field_boosts": {"title.en": 3.0},
+        "indexes": [{"name": "default", "label": "default", "fields": ["title.en"]}],
+        "query_config": {"supported_languages": ["en"], "default_language": "en"},
+        "services": {
+            "translation": {
+                "service_url": "http://localhost:6005",
+                "timeout_sec": 3.0,
+                "default_model": "dummy-model",
+                "default_scene": "general",
+                "cache": {"ttl_seconds": 60, "sliding_expiration": True},
+                "capabilities": {
+                    "dummy-model": {
+                        "enabled": True,
+                        "backend": "llm",
+                        "model": "dummy-model",
+                        "base_url": "http://localhost:6005/v1",
+                        "timeout_sec": 3.0,
+                        "use_cache": True,
+                    }
+                },
+            },
+            "embedding": {
+                "provider": "http",
+                "providers": {"http": {"text_base_url": "http://localhost:6005", "image_base_url": "http://localhost:6008"}},
+                "backend": "tei",
+                "backends": {"tei": {"base_url": "http://localhost:8080", "model_id": "dummy-embedding-model"}},
+            },
+            "rerank": {
+                "provider": "http",
+                "providers": {
+                    "http": {
+                        "instances": {
+                            "default": {"service_url": "http://localhost:6007/rerank"},
+                            "fine": {"service_url": "http://localhost:6009/rerank"},
+                        }
+                    }
+                },
+                "default_instance": "default",
+                "instances": {
+                    "default": {"port": 6007, "backend": "qwen3_vllm_score"},
+                    "fine": {"port": 6009, "backend": "bge"},
+                },
+                "backends": {
+                    "bge": {"model_name": "BAAI/bge-reranker-v2-m3"},
+                    "qwen3_vllm_score": {"model_name": "Qwen/Qwen3-Reranker-0.6B"},
+                },
+            },
+        },
+        "spu_config": {"enabled": False},
+        "function_score": {"score_mode": "sum", "boost_mode": "multiply", "functions": []},
+    }
+    config_path = tmp_path / "config.yaml"
+    config_path.write_text(yaml.safe_dump(config_data), encoding="utf-8")
+
+    loader = AppConfigLoader(config_file=config_path)
+    loaded = loader.load(validate=False)
+
+    assert loaded.services.rerank.default_instance == "default"
+    assert loaded.services.rerank.get_instance("fine").port == 6009
+    assert loaded.services.rerank.get_instance("fine").backend == "bge"
+
+
 def test_searcher_reranks_top_window_by_default(monkeypatch):
     es_client = _FakeESClient()
     searcher = _build_searcher(_build_search_config(rerank_enabled=True), es_client)
@@ -354,6 +421,82 @@ def test_searcher_reranks_top_window_by_default(monkeypatch):
     assert result.results[0].brief == "brief-20"
  
  
+def test_searcher_debug_info_exposes_ranking_funnel(monkeypatch):
+    es_client = _FakeESClient(total_hits=120)
+    searcher = _build_searcher(_build_search_config(rerank_enabled=True, rerank_window=20), es_client)
+    context = create_request_context(reqid="t-debug", uid="u-debug")
+
+    monkeypatch.setattr(
+        "search.searcher.get_tenant_config_loader",
+        lambda: SimpleNamespace(get_tenant_config=lambda tenant_id: {"index_languages": ["en"]}),
+    )
+
+    def _fake_run_lightweight_rerank(**kwargs):
+        hits = kwargs["es_hits"]
+        scores = []
+        debug_rows = []
+        for idx, hit in enumerate(hits):
+            score = float(len(hits) - idx)
+            hit["_fine_score"] = score
+            scores.append(score)
+            debug_rows.append(
+                {
+                    "doc_id": hit["_id"],
+                    "fine_score": score,
+                    "rerank_input": {"doc_preview": f"product-{hit['_id']}"},
+                }
+            )
+        hits.sort(key=lambda item: item["_fine_score"], reverse=True)
+        return scores, {"model": "fine-bge"}, debug_rows
+
+    def _fake_run_rerank(**kwargs):
+        hits = kwargs["es_response"]["hits"]["hits"]
+        fused_debug = []
+        for idx, hit in enumerate(hits):
+            hit["_rerank_score"] = 10.0 - idx
+            hit["_fused_score"] = 100.0 - idx
+            hit["_text_score"] = hit.get("_score", 0.0)
+            hit["_knn_score"] = 0.0
+            fused_debug.append(
+                {
+                    "doc_id": hit["_id"],
+                    "rerank_score": hit["_rerank_score"],
+                    "fine_score": hit.get("_fine_score"),
+                    "text_score": hit["_text_score"],
+                    "knn_score": 0.0,
+                    "rerank_factor": 1.0,
+                    "fine_factor": 1.0,
+                    "text_factor": 1.0,
+                    "knn_factor": 1.0,
+                    "fused_score": hit["_fused_score"],
+                    "matched_queries": {},
+                    "rerank_input": {"doc_preview": f"product-{hit['_id']}"},
+                }
+            )
+        return kwargs["es_response"], {"model": "final-reranker"}, fused_debug
+
+    monkeypatch.setattr("search.rerank_client.run_lightweight_rerank", _fake_run_lightweight_rerank)
+    monkeypatch.setattr("search.rerank_client.run_rerank", _fake_run_rerank)
+
+    result = searcher.search(
+        query="toy",
+        tenant_id="162",
+        from_=0,
+        size=5,
+        context=context,
+        enable_rerank=True,
+        debug=True,
+    )
+
+    assert result.debug_info["ranking_funnel"]["fine_rank"]["docs_out"] == 80
+    assert result.debug_info["ranking_funnel"]["rerank"]["docs_out"] == 20
+    first = result.debug_info["per_result"][0]["ranking_funnel"]
+    assert first["es_recall"]["rank"] is not None
+    assert first["coarse_rank"]["score"] is not None
+    assert first["fine_rank"]["score"] is not None
+    assert first["rerank"]["rerank_score"] is not None
+
+
 def test_searcher_rerank_prefetch_source_follows_doc_template(monkeypatch):
     es_client = _FakeESClient()
     searcher = _build_searcher(_build_search_config(rerank_enabled=True), es_client)