ai-saas / saas-search

18 Mar, 2026

3 commits

a47416ec 把融合逻辑改成乘法公式，并把 ES 命名子句分数回传链路补上了。 ... Browse Code »

核心改动在 rerank_client.py (line 99)：fuse_scores_and_resort 现在按
rerank * knn * text 的平滑乘法公式计算，优先从 hit["matched_queries"]
里取 base_query 和 knn_query，并把 _text_score / _knn_score
一并写回调试字段。为了让 KNN 也有名字，我给 top-level knn 加了 name:
"knn_query"，见 es_query_builder.py (line 273)。搜索执行时会在 rerank
窗口内打开 include_named_queries_score，并在显式排序时加上
track_scores，见 searcher.py (line 400) 和 es_client.py (line 224)。

2026-03-18 10:24:05 +0800

76e1f088 1. 减少一列sell points。有时候大模型输出会将这最后两列混淆，因此干脆去掉一个 ... Browse Code »
```
2. 优化缓存，缓存粒度为商品级，每次只对batch中未cache的重新计算；key使用每个商品输入的hash
```
tangwang
2026-03-18 10:15:41 +0800
a73a751f enrich Browse Code »

tangwang
2026-03-18 09:10:53 +0800

17 Mar, 2026

12 commits

e56fbdc1 query trans Browse Code »

tangwang
2026-03-17 22:47:14 +0800
0410cf4d trans Browse Code »

tangwang
2026-03-17 22:36:09 +0800
1d6727ac trans Browse Code »

tangwang
2026-03-17 22:06:54 +0800
3eff49b7 trans nllb-200-distilled-600M性能提升 Browse Code »

tangwang
2026-03-17 21:29:18 +0800
00471f80 trans Browse Code »

tangwang
2026-03-17 20:13:32 +0800
0fd2f875 translate Browse Code »

tangwang
2026-03-17 19:21:34 +0800

5e4dc8e4 翻译架构按“一个翻译服务 + ... Browse Code »

多个独立翻译能力”重构。现在业务侧不再把翻译当 provider
选型，QueryParser 和 indexer 统一通过 6006 的 translator service client
调用；真正的能力选择、启用开关、model + scene 路由，都收口到服务端和新的
translation/ 目录里了。

这次的核心改动在
config/services_config.py、providers/translation.py、api/translator_app.py、config/config.yaml
和新的 translation/service.py。配置从旧的
services.translation.provider/providers 改成了 service_url +
default_model + default_scene + capabilities，每个能力可独立
enabled；服务端新增了统一的 backend 管理与懒加载，真实实现集中到
translation/backends/qwen_mt.py、translation/backends/llm.py、translation/backends/deepl.py，旧的
query/qwen_mt_translate.py、query/llm_translate.py、query/deepl_provider.py
只保留兼容导出。接口上，/translate 现在标准支持 scene，context
作为兼容别名继续可用，健康检查会返回默认模型、默认场景和已启用能力。

2026-03-17 15:50:53 +0800

4a37d233 1. embedding cache float32 -> bf16 ... Browse Code »

2. 抽象出可复用的 embedding Redis 缓存类（图文共用）

详细：
1. embedding 缓存改为 BF16 存 Redis（读回恢复 FP32）
关键行为（按你给的流程落地）
写入前：FP32 embedding →（normalize_embeddings=True 时）L2 normalize →
转 BF16 → bytes（2字节/维，大端） → redis.setex
读取后：redis.get bytes → BF16 → 恢复 FP32（np.float32 向量）
变更点
新增 embeddings/bf16.py
提供 float32_to_bf16 / bf16_to_float32
encode_embedding_for_redis()：FP32 → BF16 → bytes
decode_embedding_from_redis()：bytes → BF16 → FP32
l2_normalize_fp32()：按需归一化
修改 embeddings/text_encoder.py
Redis value 从 pickle.dumps(np.ndarray) 改为 BF16 bytes
缓存 key 改为包含 normalize 标记：{prefix}:{n0|n1}:{query}（避免
normalize 开关不同却共用缓存）
修改 tests/test_embedding_pipeline.py
cache hit 用例改为写入 BF16 bytes，并使用新
key：embedding:n1:cached-text
修改 docs/缓存与Redis使用说明.md
embedding 缓存的 Key/Value 格式更新为 BF16 bytes + n0/n1
修改 scripts/redis/redis_cache_health_check.py
embedding pattern 不再硬编码 embedding:*，改为读取
REDIS_CONFIG["embedding_cache_prefix"]
value 预览从 pickle 解码改为 BF16 解码后展示 dim/bytes/dtype
自检
在激活环境后跑过 BF16 编解码往返 sanity check：bytes
长度、维度恢复正常；归一化向量读回后范数接近 1（会有 BF16 量化误差）。

2. 抽象出可复用的 embedding Redis 缓存类（图文共用）
新增
embeddings/redis_embedding_cache.py：RedisEmbeddingCache
统一 Redis 初始化（读 REDIS_CONFIG）
统一 BF16 bytes 编解码（复用 embeddings/bf16.py）
统一过期策略：写入 setex(expire_time)，命中读取后 expire(expire_time)
滑动过期刷新 TTL
统一异常/坏数据处理：解码失败或向量非 1D/为空/含 NaN/Inf 会删除该 key
并当作 miss
已接入复用
文本 embeddings/text_encoder.py
用 self.cache = RedisEmbeddingCache(key_prefix=..., namespace="")
key 仍是：{prefix}:{query}
图片 embeddings/image_encoder.py
用 self.cache = RedisEmbeddingCache(key_prefix=..., namespace="image")
key 仍是：{prefix}:image:{url_or_path}

2026-03-17 15:06:51 +0800

77516841 tidy embeddings Browse Code »

tangwang
2026-03-17 14:25:40 +0800
3d588bef embeddings Browse Code »

tangwang
2026-03-17 13:53:50 +0800
8b74784e cache manage Browse Code »

tangwang
2026-03-17 13:34:08 +0800

6f7840cf refactor: rename product annotator to enrich and expand multilingual prompts ... Browse Code »

- Rename indexer/product_annotator.py to indexer/product_enrich.py and remove CSV-based CLI entrypoint, keeping only in-memory analyze_products API
- Introduce dedicated product_enrich logging with separate verbose log file for full LLM requests/responses
- Change indexer and /indexer/enrich-content API wiring to use indexer.product_enrich instead of indexer.product_annotator, updating tests and docs accordingly
- Switch translate_prompts to share SUPPORTED_INDEX_LANGUAGES from tenant_config_loader and reuse that mapping for language code → display name
- Remove hard SUPPORTED_LANGS constraint from LLM content-enrichment flow, driving languages directly from tenant/indexer configuration
- Redesign LLM prompt generation to support multi-round, multi-language tables: first round in English, subsequent rounds translate the entire table (headers + cells) into target languages using English instructions

2026-03-17 11:26:03 +0800

16 Mar, 2026

4 commits

137455af doc Browse Code »

tangwang
2026-03-16 22:47:34 +0800
2d17b98e sugg Browse Code »

tangwang
2026-03-16 17:38:34 +0800
1cca75c8 sugg 索引文档 Browse Code »

tangwang
2026-03-16 17:33:50 +0800
5b8f58c0 sugg Browse Code »

tangwang
2026-03-16 16:56:57 +0800

14 Mar, 2026

1 commit

208e079a TODO Browse Code »

tangwang
2026-03-14 21:37:51 +0800

13 Mar, 2026

10 commits

af827ce9 rerank Browse Code »

tangwang
2026-03-13 23:21:51 +0800
33f8f578 tidy Browse Code »

tangwang
2026-03-13 22:59:54 +0800
d4cadc13 翻译重构 Browse Code »

tangwang
2026-03-13 20:28:08 +0800
a0a173ae last Browse Code »

tangwang
2026-03-13 16:56:44 +0800
985752f5 1. 前端调试功能 ... Browse Code »
```
2. 翻译限速 对应处理（qwen-mt限速）
```
tangwang
2026-03-13 16:15:06 +0800
f201859e docs Browse Code »

tangwang
2026-03-13 14:08:08 +0800
22ae00c7 product_annotator Browse Code »

tangwang
2026-03-13 13:48:23 +0800
77ab67ad 更新测试用例 Browse Code »

tangwang
2026-03-13 12:39:40 +0800
2260eed2 推送报警到微信群webhook Browse Code »

tangwang
2026-03-13 12:19:25 +0800
a7bb846c monitor Browse Code »

tangwang
2026-03-13 12:08:20 +0800

12 Mar, 2026

10 commits

c6da6bca add status.sh Browse Code »

tangwang
2026-03-12 23:51:43 +0800
7913e2fb 服务管理和监控 Browse Code »

tangwang
2026-03-12 23:31:59 +0800
149dad2b add rerank-cloud-perf-study Browse Code »

tangwang
2026-03-12 22:08:23 +0800
0d3e73ba rerank mini batch Browse Code »

tangwang
2026-03-12 19:57:44 +0800
d387e05d Rerank 后端对比 topn=386重新测试 Browse Code »

tangwang
2026-03-12 14:04:21 +0800
d31c7f65 补充云服务reranker Browse Code »

tangwang
2026-03-12 12:53:08 +0800
a99e62ba 记录各阶段耗时 Browse Code »

tangwang
2026-03-12 11:42:49 +0800
c51d254f 性能测试 Browse Code »

tangwang
2026-03-12 10:28:43 +0800
d71e20f0 索引同步，用于性能测试 Browse Code »

tangwang
2026-03-12 09:22:06 +0800
5f7d7f09 性能测试报告.md Browse Code »

tangwang
2026-03-12 08:44:55 +0800