ai-saas / saas-search

21 Mar, 2026

1 commit

fb973d19 configs Browse File »

tangwang
2026-03-21 22:11:41 +0800

17 Mar, 2026

1 commit

3d588bef embeddings Browse File »

tangwang
2026-03-17 13:53:50 +0800

13 Mar, 2026

2 commits

af827ce9 rerank Browse File »

tangwang
2026-03-13 23:21:51 +0800
985752f5 1. 前端调试功能 ... Browse File »
```
2. 翻译限速 对应处理（qwen-mt限速）
```
tangwang
2026-03-13 16:15:06 +0800

12 Mar, 2026

1 commit

a99e62ba 记录各阶段耗时 Browse File »

tangwang
2026-03-12 11:42:49 +0800

11 Mar, 2026

2 commits

9f5994b4 reranker Browse File »

tangwang
2026-03-11 14:26:34 +0800

efd435cf tei性能调优： ... Browse File »

./scripts/start_tei_service.sh
START_TEI=0 ./scripts/service_ctl.sh restart embedding

curl -sS -X POST "http://127.0.0.1:6005/embed/text" \
  -H "Content-Type: application/json" \
  -d '["芭比娃娃 儿童玩具", "纯棉T恤 短袖"]'

2026-03-11 13:12:44 +0800

09 Mar, 2026

2 commits

bc089b43 refactor(reranker): 对齐 Qwen3-Reranker 官方实现 ... Browse File »

config/config.yaml:
- qwen3_vllm: enable_prefix_caching true（启用前缀缓存）
- qwen3_vllm: enforce_eager false（允许 CUDA graph 加速）

reranker/backends/qwen3_vllm.py:
- TokensPrompt 导入改为 vllm.inputs.data（官方路径，兼容性更好）
- 缺失 token 时使用 logprob=-10，与官方一致（原为 1e-10）
- 使用批量 apply_chat_template 替代逐条调用，提升效率
- logprobs 访问改为官方模式：token not in last 时 -10，否则 last[token].logprob

其他: docs、embeddings、README 等文档更新

Made-with: Cursor

2026-03-09 23:48:19 +0800

07cf5a93 START_EMBEDDING=1 START_TRANSLATOR=1 START_RERANKER=1 START_TEI=1 ... Browse File »
```
CNCLIP_DEVICE=cuda TEI_USE_GPU=1 ./scripts/service_ctl.sh start
搜索后端+indexer+测试前段+4个微服务 跑通
```
tangwang
2026-03-09 23:29:07 +0800

08 Mar, 2026

1 commit

701ae503 docs Browse File »

tangwang
2026-03-08 14:30:07 +0800