## 向量化模块(embeddings) 这个目录是一个完整的“向量化模块”,包含: - **HTTP 客户端**:`text_encoder.py` / `image_encoder.py`(供搜索/索引模块调用) - **本地模型实现**:`bge_model.py` / `clip_model.py` - **向量化服务(FastAPI)**:`server.py` - **统一配置**:`config.py` ### 服务接口 - `POST /embed/text` - 入参:`["文本1", "文本2", ...]` - 出参:`[[...], null, ...]`(与输入按 index 对齐,失败为 `null`) - `POST /embed/image` - 入参:`["url或本地路径1", ...]` - 出参:`[[...], null, ...]`(与输入按 index 对齐,失败为 `null`) ### 启动服务 使用仓库脚本启动(默认端口 6005): ```bash ./scripts/start_embedding_service.sh ``` ### 修改配置 编辑 `embeddings/config.py`: - `PORT`: 服务端口(默认 6005) - `TEXT_MODEL_DIR`, `TEXT_DEVICE`, `TEXT_BATCH_SIZE` - `IMAGE_MODEL_NAME`, `IMAGE_DEVICE`