Blame view

embeddings/README.md 961 Bytes
7bfb9946   tangwang   向量化模块
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
  ## 向量化模块(embeddings)
  
  这个目录是一个完整的“向量化模块”,包含:
  
  - **HTTP 客户端**`text_encoder.py` / `image_encoder.py`(供搜索/索引模块调用)
  - **本地模型实现**`bge_model.py` / `clip_model.py`
  - **向量化服务(FastAPI)**`server.py`
  - **统一配置**`config.py`
  
  ### 服务接口
  
  - `POST /embed/text`
    - 入参:`["文本1", "文本2", ...]`
    - 出参:`[[...], null, ...]`(与输入按 index 对齐,失败为 `null`
  
  - `POST /embed/image`
    - 入参:`["url或本地路径1", ...]`
    - 出参:`[[...], null, ...]`(与输入按 index 对齐,失败为 `null`
  
  ### 启动服务
  
  使用仓库脚本启动(默认端口 6005):
  
  ```bash
  ./scripts/start_embedding_service.sh
  ```
  
  ### 修改配置
  
  编辑 `embeddings/config.py`
  
  - `PORT`: 服务端口(默认 6005)
  - `TEXT_MODEL_DIR`, `TEXT_DEVICE`, `TEXT_BATCH_SIZE`
  - `IMAGE_MODEL_NAME`, `IMAGE_DEVICE`