Tokenizer de Llama 3

Les grands modèles de langage comme Llama 3.1 décodent le texte par des tokens—séquences de caractères fréquentes dans un corpus de texte. Ces modèles maîtrisent l'art de reconnaître les motifs parmi les tokens, prédisant habilement le token suivant dans une série.

Ci-dessous, vous trouverez un outil conçu pour montrer comment des modèles Llama 3 tels que

Llama 3.1 70B
Llama 3 70B
Llama 3.1 8B
décomposent un texte en tokens, ainsi qu'un décompte du total des tokens présents dans le texte.

Tokens

1

Caractères

5

Hello

Plus de tokenizers

Tous les 15 jours — les dernières nouvelles de l'IA dans votre boîte

Plus de 10 000 abonnés de Nvidia, OpenAI et bien d'autres

Dernières sorties de modèles & nouvelles du secteur

Pas de blabla, prend < 2 min à lire

Construire un chatbot IA ?

Surveillance GenAI open-source, gestion des prompts, et magie.

Open Source

Self Hostable

1-line Integration

Prompt Templates

Chat Replays

Analytics

Topic Classification

Agent Tracing

Custom Dashboards

Score LLM responses

PII Masking

Feedback Tracking

Open Source

Self Hostable

1-line Integration

Prompt Templates

Chat Replays

Analytics

Topic Classification

Agent Tracing

Custom Dashboards

Score LLM responses

PII Masking

Feedback Tracking