Tokenizador de Mistral

Los modelos de lenguaje grande como Mistral decodifican texto a través de tokens, secuencias frecuentes de caracteres dentro de un corpus de texto. Estos modelos dominan el arte de reconocer patrones entre tokens, prediciendo hábilmente el token siguiente en una serie.

A continuación, encontrarás una herramienta diseñada para mostrar cómo los modelos Mistral como

Mistral 7B
Mixtral 8X7B
Mistral Medium
Mistral Small
descomponen un texto en tokens, junto con un conteo de los tokens totales presentes en el texto.

Tokens

1

Caracteres

5

Hello

Más tokenizers

Cada 2 semanas, las últimas novedades de IA en tu inbox

Más de 10,000 suscriptores de Nvidia, OpenAI y más

Últimas versiones de modelos y noticias del sector

Sin rodeos, menos de 2 min de lectura

¿Construyendo un chatbot de IA?

Monitoreo genérico de IA de código abierto, gestión de prompts y magia.

Open Source

Self Hostable

1-line Integration

Prompt Templates

Chat Replays

Analytics

Topic Classification

Agent Tracing

Custom Dashboards

Score LLM responses

PII Masking

Feedback Tracking

Open Source

Self Hostable

1-line Integration

Prompt Templates

Chat Replays

Analytics

Topic Classification

Agent Tracing

Custom Dashboards

Score LLM responses

PII Masking

Feedback Tracking