Оценка и валидация производительности LLM