1
0

Доработка rag, удаление скриптов моделей, актуализация README

This commit is contained in:
2025-08-31 00:51:42 +08:00
parent c408972b45
commit defc30cad0
108 changed files with 635 additions and 745 deletions

17
rag/CHECKLIST.md Normal file
View File

@@ -0,0 +1,17 @@
# Чек-лист по построению RAG
* [ ] Определиться с форматом входных данных
* [ ] Очистить входные данные, обеспечив метаданными
* [ ] Подобрать модель эмбеддинга
* [ ] Подобрать размер чанка и перекрытия для эмбеддинга
* [ ] Подобрать место хранения (векторная СУБД)
* [ ] Подобрать модель ранжирования
* [ ] Подобрать модель генерации
* [ ] Подобрать для неё системный промпт (для встраивания найденных чанков, грамотного их цитирования)
* [ ] Подобрать параметры:
* [ ] top_k (количество чанков для поиска при эмбеддинге)
* [ ] top_n (остаток найденных чанков после ранжирования)
* [ ] temperature (степень фантазии)
* [ ] top_p (???)
* [ ] другие?
* [ ]