Cómo usar modelos de IA con tokenizadores personalizados

sam · 2 Marzo, 2026 04:10

También vale la pena señalar… la mayoría de los agentes de codificación hoy en día ni siquiera se molestan con un tokenizador preciso como lo hace Discourse. Simplemente estiman 4 letras por token.

cl100k será más que suficiente para la gran mayoría de los casos de uso en modelos de lenguaje grande (llms) con tokenizadores ligeramente diferentes.

Tema		Respuestas	Vistas
Adding Semantic Search feature for our self-hosted discourse site Support ai , ai-search	9	253	19 Marzo 2025
Frustrations on AI spam detector Support spam , ai	9	137	21 Diciembre 2025
Configuring OpenRouter language models Integrations ai	0	1027	10 Diciembre 2024
How to implement Mistral with Embeddings Support related-topics , ai	6	227	11 Mayo 2025
Inquiry About AI Plugin Options Support ai	7	133	24 Noviembre 2025

Cómo usar modelos de IA con tokenizadores personalizados

Temas relacionados