Установка сервера AI

Подключаемся к серверу по SSH под пользователем с правами root.

Установка Docker

⚠️

Сервер использует подсеть server_ai, которая создается автоматически при первом запуске финальной команды данной статьи.

Загрузка образов

См. размещение образов

Размещение файлов

Создаем папку /app/Primo.AI/Api и дочерние:


sudo mkdir -p /app/Primo.AI/Api/volumes/conf/Api/ /app/Primo.AI/Api/volumes/conf/Auth/ /app/Primo.AI/Api/volumes/conf/Logs/ /app/Primo.AI/Api/volumes/conf/MachineInfo/ /app/Primo.AI/Api/volumes/conf/Inference/ /app/Primo.AI/Api/volumes/nginx/ /app/Primo.AI/Api/volumes/Api_Models/ /app/Primo.AI/Api/volumes/Api_ContextFiles/ /app/Primo.AI/Api/volumes/Logs/

Размещаем окружение сервера в /app/Primo.AI/Api:
```
sudo cp docker/server/docker-compose.yaml /app/Primo.AI/Api/
```
```
sudo cp -r docker/server/volumes/* /app/Primo.AI/Api/volumes/
```
```
sudo unzip docker/server/env.zip -d /app/Primo.AI/Api/
```
При необходимости укажите нестандартные учётные данные БД, RabbitMQ или временную зону в .env-файле:
```
sudo nano /app/Primo.AI/Api/.env
```

Размещаем файлы моделей Умного OCR:


sudo cp -r data/models/SmartOCR/* /app/Primo.AI/Api/volumes/Api_Models/

Размещаем файлы моделей AI Текст.

Модели AI Текст:

Имя модели	LLM-ядро	Мультимодальность	Имя файла
base-LLM-01-7b-safetensors-fp16 (vLLM, 8B)	vLLM	нет	`e255188e-d9f6-41d3-b170-0c25bc0bd02f`
base-LLM-01-7b-gguf-q8 (Ollama, 8B)	Ollama	нет	`ddc02d8d-0117-4c67-acb3-2dd0549d2985`
base-LLM-06-7b-gguf-q8 (Ollama, multimodal, 7B)	Ollama	да	`f55425a0-87c8-4d9e-a4cd-abc56f96ab1e`
base-LLM-06-7b-safetensors-fp16 (vLLM, multimodal, 7B)	vLLM	да	`78e57e23-363c-4b1e-b4e2-36fb31da5b48`
base-LLM-07-8b-safetensors-fp16 (vLLM, 8B)	vLLM	нет	`e161b94d-3272-4afa-9aad-d191b61c67d3`
base-LLM-06-7b-gguf-fp16 (Ollama, multimodal, 7B)	Ollama	да	`c7a88b7f-bf7e-484b-bcc4-fea147315c83`
base-LLM-06-32b-gguf-q4_k_m (Ollama, multimodal, 32B)	Ollama	да	`68c2d421-1877-4693-b53f-2e1ca1079db8`
base-LLM-08-27b-gguf-q4_k_m (Ollama, multimodal, 27B)	Ollama	да	`1fc223ef-7a13-42db-8bcb-5fda5a39779e`
base-LLM-09-30b-gguf-q4_k_m (Ollama, thinking, 30B)	Ollama	нет	`7be7740d-64bc-4d07-a3b2-5ba5e6815e17`
base-LLM-10-4b-safetensors-base (vLLM, 4B)	vLLM	нет	`98291769-7a84-468f-af2a-5ea4bb02f72a`

Файлы моделей объемные, поэтому можно скопировать только отдельные (укажите вместо ‘xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx’ имя файла модели, воспользовавшись столбцом “Имя файла” из таблицы выше).


sudo cp data/models/NLP/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx /app/Primo.AI/Api/volumes/Api_Models/

Либо, если места достаточно, скопируйте все модели:


sudo cp data/models/NLP/* /app/Primo.AI/Api/volumes/Api_Models/

Если разместить только часть моделей, то при попытке использования остальных моделей, интерфейс системы будет выдавать ошибку.

Размещаем стандартный контекст NLP-запросов:


sudo cp -r data/context/* /app/Primo.AI/Api/volumes/Api_ContextFiles/

Должна получиться следующая иерархия папок для соответствия стандартному docker-compose.yaml:


/app/Primo.AI/Api/
├── .env
├── docker-compose.yaml
└── volumes
    ├── conf
    │   └── Api
    │       └── appsettings.ProdLinux.json
    │
    │   └── Logs
    │       └── appsettings.ProdLinux.json
    │
    │   └── Inference
    │       └── appsettings.ProdLinux.json
    │
    │   └── Auth
    │       └── appsettings.ProdLinux.json
    │
    │   └── nginx
    │       └── nginx.conf
    ├── Api_Models
    │   ├─── cf7d9f7f-ab96-4c15-873e-82c6aad7f9a4
    │   ├─── 3901af0a-8c50-4b76-b96f-481cae5e4a35
    │   ├─── ...
    │   └─── e161b94d-3272-4afa-9aad-d191b61c67d3
    ├── Api_ContextFiles
    │   ├─── 13fb0ff5-3f31-44e1-9c99-e24276380a3f
    │   ├─── e41cc59b-059f-4471-8d09-328aab8ed60f
    │   ├─── a9d109d6-0125-42f9-b44e-2052a0c4e164
    │   └─── d24b857c-6c21-4d5f-990f-52d6235c33dd
    └── Logs

Редактируем конфигурационные файлы

Конфигурационный файл Api

Открываем в редакторе конфигурационный файл:
```
sudo nano /app/Primo.AI/Api/volumes/conf/Api/appsettings.ProdLinux.json
```

Указываем адрес портала AI Server в Security > EnabledOrigins:


"Security": {
 ...
 "EnabledOrigins": [
   "https://192.168.0.4:44392",
   "https://ai-server-portal:44392"
 ],
 ...
}

Конфигурационный файл Api.Auth

Открываем в редакторе конфигурационный файл:
```
sudo nano /app/Primo.AI/Api/volumes/conf/Auth/appsettings.ProdLinux.json
```

Указываем адрес портала AI Server в Security > EnabledOrigins:


"Security": {
 ...
 "EnabledOrigins": [
   "https://192.168.0.4:44392",
   "https://ai-server-portal:44392"
 ],
 ...
}

Конфигурационный файл Api.Inference

Открываем в редакторе конфигурационный файл:
```
sudo nano /app/Primo.AI/Api/volumes/conf/Inference/appsettings.ProdLinux.json
```

Указываем адрес портала AI Server в Security > EnabledOrigins:


"Security": {
 ...
 "EnabledOrigins": [
   "https://192.168.0.4:44392",
   "https://ai-server-portal:44392"
 ],
 ...
}

Конфигурационный файл Api.Logs

Открываем в редакторе конфигурационный файл:
```
sudo nano /app/Primo.AI/Api/volumes/conf/Logs/appsettings.ProdLinux.json
```

Указываем адрес портала AI Server в Security > EnabledOrigins:


"Security": {
 ...
 "EnabledOrigins": [
   "https://192.168.0.4:44392",
   "https://ai-server-portal:44392"
 ],
 ...
}

Конфигурационный файл nginx

При необходимости можно указать в конфигурационном файле число рабочих процессов, максимальное число соединений, которые одновременно может открыть рабочий процесс, и другие параметры.

Открываем в редакторе конфигурационный файл:


sudo nano /app/Primo.AI/Api/volumes/nginx/nginx.conf

SSO

При необходимости можно подключить авторизацию через Keycloak.

Разрешения

Даем томам контейнеров права на запись:


sudo chmod -R 777 /app/Primo.AI/Api/volumes/

Порт

Откройте порт 44392:


sudo ufw allow 44392/tcp

Запуск контейнеров


docker compose -f /app/Primo.AI/Api/docker-compose.yaml up -d

Что дальше

Установите Api.MachineInfo.