¿Qué modelo de Ollama os resulta más efectivo?

Hola.
Tengo una tarjeta gráfica de 16GB y no me entran los modelos grandes, ¿cuál es el LLM que soleis usar vosotros?
últimamente estoy con llama 3,2, pero falla mucho.

a nosotros el que mejor nos funciona es Gemma2 de 9b

También tenemos una gráfica de 16GB