Tokenizer de OpenAI

Les grands modèles de langage comme OpenAI décodent le texte par des tokens—séquences de caractères fréquentes dans un corpus de texte. Ces modèles maîtrisent l'art de reconnaître les motifs parmi les tokens, prédisant habilement le token suivant dans une série.

Ci-dessous, vous trouverez un outil conçu pour montrer comment des modèles OpenAI tels que

gpt-3.5-turbo
gpt-4o
o1-preview
o1-mini
gpt-4o-mini
décomposent un texte en tokens, ainsi qu'un décompte du total des tokens présents dans le texte.

Tokens

1

Caractères

5

Hello

Plus de tokenizers

Tous les 15 jours — les dernières nouvelles de l'IA dans votre boîte

Plus de 10 000 abonnés de Nvidia, OpenAI et bien d'autres

Dernières sorties de modèles & nouvelles du secteur

Pas de blabla, prend < 2 min à lire

Construire un chatbot IA ?

Surveillance GenAI open-source, gestion des prompts, et magie.

Open Source

Self Hostable

1-line Integration

Prompt Templates

Chat Replays

Analytics

Topic Classification

Agent Tracing

Custom Dashboards

Score LLM responses

PII Masking

Feedback Tracking

Open Source

Self Hostable

1-line Integration

Prompt Templates

Chat Replays

Analytics

Topic Classification

Agent Tracing

Custom Dashboards

Score LLM responses

PII Masking

Feedback Tracking