anthony/ollama

Go to file

AnthonyAxenov 64a63f048a

Скрипты генерации rag

2025-08-19 09:51:12 +08:00

.data

2025-05-25 15:13:45 +08:00

Скрипты генерации rag

2025-08-19 09:51:12 +08:00

Скрипты генерации rag

2025-08-19 09:51:12 +08:00

Команда для списка моделей + codegemma 3/7

2025-05-25 20:53:22 +08:00

Пачка моделей qwen + deepseek-coder-v2

2025-05-25 15:01:42 +08:00

Добавлены granite-code

2025-05-25 15:07:13 +08:00

codestral

2025-08-16 21:27:42 +08:00

deepcoder

2025-08-16 21:27:55 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

deepseek-coder-v2

Пачка моделей qwen + deepseek-coder-v2

2025-05-25 15:01:42 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

devstral

2025-08-16 21:28:04 +08:00

dolphin3

2025-08-16 21:28:19 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

Корректировки по README и мелочи

2025-08-17 01:17:30 +08:00

gemma3n

2025-08-16 21:28:41 +08:00

gpt-oss

2025-08-16 21:28:49 +08:00

Добавлены granite-code

2025-05-25 15:07:13 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

Мелочи по скриптам

2025-08-18 00:42:47 +08:00

llava-llama3

2025-08-16 21:28:58 +08:00

magistral

2025-08-16 21:29:08 +08:00

mistral

2025-08-16 21:29:14 +08:00

mistral-nemo

2025-08-16 21:29:26 +08:00

mistral-small

2025-08-16 21:29:41 +08:00

mixtral

2025-08-16 21:30:51 +08:00

mxbai-embed-large

mxbai-embed-large:latest

2025-08-18 00:43:34 +08:00

nomic-embed-text

nomic-embed-text:latest

2025-08-18 00:43:23 +08:00

openthinker

2025-08-16 21:31:02 +08:00

phi

2025-08-16 21:31:08 +08:00

Переложил и добавил модели по папкам, обновил README

2025-05-25 14:45:00 +08:00

phi3.5

2025-08-16 21:31:18 +08:00

phi4

2025-08-16 21:31:27 +08:00

Корректировки по README и мелочи

2025-08-17 01:17:30 +08:00

phi4-reasoning

2025-08-16 21:31:47 +08:00

qwen1.5 rename

2025-08-16 21:32:12 +08:00

Добавлены granite-code

2025-05-25 15:07:13 +08:00

Добавлены granite-code

2025-05-25 15:07:13 +08:00

fixed qwen2.5-coder:0.5b

2025-08-16 21:32:27 +08:00

Добавлены granite-code

2025-05-25 15:07:13 +08:00

qwen3-coder

2025-08-16 21:32:38 +08:00

qwq

2025-08-16 21:32:44 +08:00

smollm2

2025-08-16 21:32:54 +08:00

stable-code

2025-08-18 00:43:45 +08:00

starcoder2

2025-08-16 21:27:20 +08:00

.gitignore

.data

2025-05-25 15:13:45 +08:00

down.sh

Initial commit

2025-05-24 10:51:09 +08:00

list.sh

Команда для списка моделей + codegemma 3/7

2025-05-25 20:53:22 +08:00

ollama.code-workspace

Скрипты генерации rag

2025-08-19 09:51:12 +08:00

ollama.sh

Мелочи по скриптам

2025-08-18 00:42:47 +08:00

README.md

Скрипты генерации rag

2025-08-19 09:51:12 +08:00

run.sh

Скрипты генерации rag

2025-08-19 09:51:12 +08:00

README.md

Local ollama

Набор скриптов для быстрого запуска локальных LLM.

Модели подбираются вручную, примерно в пределазх 40 млрд параметров (обычно, максимум 32b или 34b). Такие модели наиболее реально запускать на среднем ПК.

Меньше параметров → меньше памяти на диске и в ОЗУ → выше скорость (tps) → ниже качество.

Больше параметров → больше памяти на диске и в ОЗУ → ниже скорость (tps) → выше качество.

Модели до 7 млрд достаточно хорошо отвечают (до 5-10 tps) на i5-9400 CPU 2.90GHz + 32 Гб ОЗУ без видеокарты, при условии, что в один момент времени одна модель обрабатывает один запрос. Например, phi4-mini:3.8b или qwen2.5:7b.

Стек

Как использовать

Запустить ./run.sh
Запустить скрипт из любой и поддиректорий для скачивания и запуска модели в терминале
Открыть веб-морду по адресу localhost:9999

Для настройки vscode поставить один из плагинов:

Для настройки idea поставить плагин:

Плагины должны соединиться с localhost:11434 и подгрузить доступные модели из контейнера.

Использование RAG системы

RAG (Retrieval-Augmented Generation) система позволяет задавать вопросы по содержимому документации.

Для работы RAG системы необходимо:

Установить необходимые системные зависимости (требуется только один раз):
```
sudo apt install -y python3-pip python3.13-venv
```
Создать виртуальное окружение и установить Python-зависимости:
```
python3 -m venv venv
source venv/bin/activate
pip install requests numpy scikit-learn
```
Запустить сервер Ollama (если еще не запущен):
```
./run.sh
```
Запустить RAG систему:
```
./run_rag.sh
```

После запуска система задаст пример вопроса и выведет ответ.

Дополнительные материалы