Tokenizer de Mistral

Les grands modèles de langage tels que Mistral décodent le texte à travers des tokens—séquences de caractères fréquentes dans un corpus de texte.

Ces modèles maîtrisent l'art de reconnaître les motifs parmi les tokens, prédisant habilement le token suivant dans une série.

Ci-dessous, vous trouverez un outil conçu pour montrer comment les modèles Mistral tels que

Mistral 7B
Mixtral 8X7B
Mistral Medium
Mistral Small
décomposent un texte en tokens, avec en plus le compte total des tokens présents dans le texte.

Tokens:

1

Caractères:

5

Hello

Plus de tokenizers

Vous construisez un produit IA ?

Lunary : open-source de surveillance GenAI, gestion de prompts, et magie.

Open Source

Self Hostable

Evaluations

Alerts

Public API

Exports

Prompt Templates

Chat Replays

Agent Tracing

Metrics

Feedback Tracking

LangChain Support

Open Source

Self Hostable

Evaluations

Alerts

Public API

Exports

Prompt Templates

Chat Replays

Agent Tracing

Metrics

Feedback Tracking

LangChain Support