Корректировка размера чанков и перекрытия
This commit is contained in:
@@ -96,7 +96,7 @@ class LocalRAGSystem:
|
|||||||
|
|
||||||
return None
|
return None
|
||||||
|
|
||||||
def chunk_text(self, text: str, chunk_size: int = 1000, overlap: int = 200) -> List[str]:
|
def chunk_text(self, text: str, chunk_size: int = 500, overlap: int = 100) -> List[str]:
|
||||||
"""Разбиваем текст на чанки с перекрытием"""
|
"""Разбиваем текст на чанки с перекрытием"""
|
||||||
chunks = []
|
chunks = []
|
||||||
start = 0
|
start = 0
|
||||||
@@ -444,7 +444,7 @@ def main():
|
|||||||
parser.add_argument("--md-folder", default="output_md", help="Папка с markdown файлами")
|
parser.add_argument("--md-folder", default="output_md", help="Папка с markdown файлами")
|
||||||
parser.add_argument("--embed-model", default="nomic-embed-text", help="Модель для эмбеддингов")
|
parser.add_argument("--embed-model", default="nomic-embed-text", help="Модель для эмбеддингов")
|
||||||
parser.add_argument("--chat-model", default="phi4-mini:3.8b", help="Модель для чата")
|
parser.add_argument("--chat-model", default="phi4-mini:3.8b", help="Модель для чата")
|
||||||
parser.add_argument("--results", type=int, default=5, help="Количество результатов поиска")
|
parser.add_argument("--results", type=int, default=10, help="Количество результатов поиска")
|
||||||
|
|
||||||
args = parser.parse_args()
|
args = parser.parse_args()
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user