ai-saas / saas-search

09 Mar, 2026

3 commits

bc089b43 refactor(reranker): 对齐 Qwen3-Reranker 官方实现 ... Browse File »

config/config.yaml:
- qwen3_vllm: enable_prefix_caching true（启用前缀缓存）
- qwen3_vllm: enforce_eager false（允许 CUDA graph 加速）

reranker/backends/qwen3_vllm.py:
- TokensPrompt 导入改为 vllm.inputs.data（官方路径，兼容性更好）
- 缺失 token 时使用 logprob=-10，与官方一致（原为 1e-10）
- 使用批量 apply_chat_template 替代逐条调用，提升效率
- logprobs 访问改为官方模式：token not in last 时 -10，否则 last[token].logprob

其他: docs、embeddings、README 等文档更新

Made-with: Cursor

2026-03-09 23:48:19 +0800

07cf5a93 START_EMBEDDING=1 START_TRANSLATOR=1 START_RERANKER=1 START_TEI=1 ... Browse File »
```
CNCLIP_DEVICE=cuda TEI_USE_GPU=1 ./scripts/service_ctl.sh start
搜索后端+indexer+测试前段+4个微服务 跑通
```
tangwang
2026-03-09 23:29:07 +0800
950a640e embeddings Browse File »

tangwang
2026-03-09 15:59:14 +0800

08 Mar, 2026

1 commit

c10f90fe cnclip Browse File »

tangwang
2026-03-08 12:53:46 +0800

07 Mar, 2026

1 commit

42e3aea6 tidy Browse File »

tangwang
2026-03-07 19:44:25 +0800

22 Dec, 2025

2 commits

0a3764c4 优化embedding模型加载 Browse File »

tangwang
2025-12-22 14:38:13 +0800
7bfb9946 向量化模块 Browse File »

tangwang
2025-12-22 14:25:15 +0800

08 Nov, 2025

1 commit

be52af70 first commit Browse Dir »

tangwang
2025-11-08 00:07:09 +0800

07 Nov, 2025

1 commit

9ad73d6e first commit Browse Dir »

tangwang
2025-11-07 15:45:42 +0800