7bfb9946
tangwang
向量化模块
|
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
这个目录是一个完整的“向量化模块”,包含:
- **HTTP 客户端**:`text_encoder.py` / `image_encoder.py`(供搜索/索引模块调用)
- **本地模型实现**:`bge_model.py` / `clip_model.py`
- **向量化服务(FastAPI)**:`server.py`
- **统一配置**:`config.py`
### 服务接口
- `POST /embed/text`
- 入参:`["文本1", "文本2", ...]`
- 出参:`[[...], null, ...]`(与输入按 index 对齐,失败为 `null`)
- `POST /embed/image`
- 入参:`["url或本地路径1", ...]`
- 出参:`[[...], null, ...]`(与输入按 index 对齐,失败为 `null`)
### 启动服务
使用仓库脚本启动(默认端口 6005):
```bash
./scripts/start_embedding_service.sh
```
### 修改配置
编辑 `embeddings/config.py`:
- `PORT`: 服务端口(默认 6005)
- `TEXT_MODEL_DIR`, `TEXT_DEVICE`, `TEXT_BATCH_SIZE`
- `IMAGE_MODEL_NAME`, `IMAGE_DEVICE`
|