Sim calcule automatiquement les coûts pour toutes les exécutions de flux de travail, offrant une tarification transparente basée sur l'utilisation des modèles d'IA et les frais d'exécution. Comprendre ces coûts vous aide à optimiser les flux de travail et à gérer efficacement votre budget.
Comment les coûts sont calculés
Chaque exécution de flux de travail comprend deux composantes de coût :
Frais d'exécution de base : 0,001 $ par exécution
Utilisation du modèle d'IA : coût variable basé sur la consommation de tokens
modelCost = (inputTokens × inputPrice + outputTokens × outputPrice) / 1,000,000
totalCost = baseExecutionCharge + modelCostLes prix des modèles d'IA sont par million de tokens. Le calcul divise par 1 000 000 pour obtenir le coût réel. Les flux de travail sans blocs d'IA n'engendrent que les frais d'exécution de base.
Répartition des modèles dans les journaux
Pour les flux de travail utilisant des blocs d'IA, vous pouvez consulter des informations détaillées sur les coûts dans les journaux :

La répartition des modèles montre :
- Utilisation des tokens : nombre de tokens d'entrée et de sortie pour chaque modèle
- Ventilation des coûts : coûts individuels par modèle et opération
- Distribution des modèles : quels modèles ont été utilisés et combien de fois
- Coût total : coût global pour l'ensemble de l'exécution du flux de travail
Options de tarification
Modèles hébergés - Sim fournit des clés API avec un multiplicateur de prix de 1,4x pour les blocs Agent :
OpenAI
| Modèle | Prix de base (entrée/sortie) | Prix hébergé (entrée/sortie) |
|---|---|---|
| GPT-5.1 | 1,25 $ / 10,00 $ | 1,75 $ / 14,00 $ |
| GPT-5 | 1,25 $ / 10,00 $ | 1,75 $ / 14,00 $ |
| GPT-5 Mini | 0,25 $ / 2,00 $ | 0,35 $ / 2,80 $ |
| GPT-5 Nano | 0,05 $ / 0,40 $ | 0,07 $ / 0,56 $ |
| GPT-4o | 2,50 $ / 10,00 $ | 3,50 $ / 14,00 $ |
| GPT-4.1 | 2,00 $ / 8,00 $ | 2,80 $ / 11,20 $ |
| GPT-4.1 Mini | 0,40 $ / 1,60 $ | 0,56 $ / 2,24 $ |
| GPT-4.1 Nano | 0,10 $ / 0,40 $ | 0,14 $ / 0,56 $ |
| o1 | 15,00 $ / 60,00 $ | 21,00 $ / 84,00 $ |
| o3 | 2,00 $ / 8,00 $ | 2,80 $ / 11,20 $ |
| o4 Mini | 1,10 $ / 4,40 $ | 1,54 $ / 6,16 $ |
Anthropic
| Modèle | Prix de base (entrée/sortie) | Prix hébergé (entrée/sortie) |
|---|---|---|
| Claude Opus 4.5 | 5,00 $ / 25,00 $ | 7,00 $ / 35,00 $ |
| Claude Opus 4.1 | 15,00 $ / 75,00 $ | 21,00 $ / 105,00 $ |
| Claude Sonnet 4.5 | 3,00 $ / 15,00 $ | 4,20 $ / 21,00 $ |
| Claude Sonnet 4.0 | 3,00 $ / 15,00 $ | 4,20 $ / 21,00 $ |
| Claude Haiku 4.5 | 1,00 $ / 5,00 $ | 1,40 $ / 7,00 $ |
| Modèle | Prix de base (entrée/sortie) | Prix hébergé (entrée/sortie) |
|---|---|---|
| Gemini 3 Pro Preview | 2,00 $ / 12,00 $ | 2,80 $ / 16,80 $ |
| Gemini 2.5 Pro | 1,25 $ / 10,00 $ | 1,75 $ / 14,00 $ |
| Gemini 2.5 Flash | 0,30 $ / 2,50 $ | 0,42 $ / 3,50 $ |
Le multiplicateur de 1,4x couvre les coûts d'infrastructure et de gestion des API.
Vos propres clés API - Utilisez n'importe quel modèle au prix de base :
| Fournisseur | Exemples de modèles | Entrée / Sortie |
|---|---|---|
| Deepseek | V3, R1 | 0,75 $ / 1,00 $ |
| xAI | Grok 4 Latest, Grok 3 | 3,00 $ / 15,00 $ |
| Groq | Llama 4 Scout, Llama 3.3 70B | 0,11 $ / 0,34 $ |
| Cerebras | Llama 4 Scout, Llama 3.3 70B | 0,11 $ / 0,34 $ |
| Ollama | Modèles locaux | Gratuit |
| VLLM | Modèles locaux | Gratuit |
Payez directement les fournisseurs sans majoration
Les prix indiqués reflètent les tarifs en date du 10 septembre 2025. Consultez la documentation des fournisseurs pour les tarifs actuels.
Apportez votre propre clé (BYOK)
Vous pouvez utiliser vos propres clés API pour les modèles hébergés (OpenAI, Anthropic, Google, Mistral) dans Paramètres → BYOK pour payer les prix de base. Les clés sont chiffrées et s'appliquent à l'ensemble de l'espace de travail.
Stratégies d'optimisation des coûts
- Sélection du modèle : choisissez les modèles en fonction de la complexité de la tâche. Les tâches simples peuvent utiliser GPT-4.1-nano tandis que le raisonnement complexe peut nécessiter o1 ou Claude Opus.
- Ingénierie des prompts : des prompts bien structurés et concis réduisent l'utilisation de jetons sans sacrifier la qualité.
- Modèles locaux : utilisez Ollama ou VLLM pour les tâches non critiques afin d'éliminer complètement les coûts d'API.
- Mise en cache et réutilisation : stockez les résultats fréquemment utilisés dans des variables ou des fichiers pour éviter les appels répétés aux modèles d'IA.
- Traitement par lots : traitez plusieurs éléments dans une seule requête d'IA plutôt que d'effectuer des appels individuels.
Surveillance de l'utilisation
Surveillez votre utilisation et votre facturation dans Paramètres → Abonnement :
- Utilisation actuelle : utilisation et coûts en temps réel pour la période en cours
- Limites d'utilisation : limites du forfait avec indicateurs de progression visuels
- Détails de facturation : frais projetés et engagements minimums
- Gestion du forfait : options de mise à niveau et historique de facturation
Suivi programmatique de l'utilisation
Vous pouvez interroger votre utilisation et vos limites actuelles de manière programmatique à l'aide de l'API :
Point de terminaison :
GET /api/users/me/usage-limitsAuthentification :
- Incluez votre clé API dans l'en-tête
X-API-Key
Exemple de requête :
curl -X GET -H "X-API-Key: YOUR_API_KEY" -H "Content-Type: application/json" https://sim.ai/api/users/me/usage-limitsExemple de réponse :
{
"success": true,
"rateLimit": {
"sync": {
"isLimited": false,
"requestsPerMinute": 25,
"maxBurst": 50,
"remaining": 50,
"resetAt": "2025-09-08T22:51:55.999Z"
},
"async": {
"isLimited": false,
"requestsPerMinute": 200,
"maxBurst": 400,
"remaining": 400,
"resetAt": "2025-09-08T22:51:56.155Z"
},
"authType": "api"
},
"usage": {
"currentPeriodCost": 12.34,
"limit": 100,
"plan": "pro"
}
}Champs de limite de débit :
requestsPerMinute: limite de débit soutenue (les jetons se rechargent à ce rythme)maxBurst: nombre maximum de jetons que vous pouvez accumuler (capacité de rafale)remaining: jetons actuellement disponibles (peut aller jusqu'àmaxBurst)
Champs de réponse :
currentPeriodCostreflète l'utilisation dans la période de facturation actuellelimitest dérivé des limites individuelles (Free/Pro) ou des limites d'organisation mutualisées (Team/Enterprise)planest le forfait actif de priorité la plus élevée associé à votre utilisateur
Limites des forfaits
Les différents forfaits d'abonnement ont des limites d'utilisation différentes :
| Forfait | Limite d'utilisation mensuelle | Limites de débit (par minute) |
|---|---|---|
| Gratuit | 20 $ | 5 sync, 10 async |
| Pro | 100 $ | 10 sync, 50 async |
| Équipe | 500 $ (mutualisé) | 50 sync, 100 async |
| Entreprise | Personnalisé | Personnalisé |
Modèle de facturation
Sim utilise un modèle de facturation abonnement de base + dépassement :
Fonctionnement
Forfait Pro (20 $/mois) :
- L'abonnement mensuel inclut 20 $ d'utilisation
- Utilisation inférieure à 20 $ → Aucun frais supplémentaire
- Utilisation supérieure à 20 $ → Paiement du dépassement en fin de mois
- Exemple : 35 $ d'utilisation = 20 $ (abonnement) + 15 $ (dépassement)
Forfait Équipe (40 $/utilisateur/mois) :
- Utilisation mutualisée entre tous les membres de l'équipe
- Dépassement calculé sur l'utilisation totale de l'équipe
- Le propriétaire de l'organisation reçoit une seule facture
Forfaits Entreprise :
- Prix mensuel fixe, sans dépassement
- Limites d'utilisation personnalisées selon l'accord
Facturation par seuil
Lorsque le dépassement non facturé atteint 50 $, Sim facture automatiquement le montant total non facturé.
Exemple :
- Jour 10 : 70 $ de dépassement → Facturation immédiate de 70 $
- Jour 15 : 35 $ d'utilisation supplémentaire (105 $ au total) → Déjà facturé, aucune action
- Jour 20 : 50 $ d'utilisation supplémentaire (155 $ au total, 85 $ non facturé) → Facturation immédiate de 85 $
Cela répartit les frais de dépassement importants tout au long du mois au lieu d'une seule facture importante en fin de période.
Bonnes pratiques de gestion des coûts
- Surveillez régulièrement : Consultez fréquemment votre tableau de bord d'utilisation pour éviter les surprises
- Définissez des budgets : Utilisez les limites des forfaits comme garde-fous pour vos dépenses
- Optimisez les flux de travail : Examinez les exécutions coûteuses et optimisez les prompts ou la sélection de modèles
- Utilisez les modèles appropriés : Adaptez la complexité du modèle aux exigences de la tâche
- Regroupez les tâches similaires : Combinez plusieurs requêtes lorsque c'est possible pour réduire les frais généraux
Prochaines étapes
- Consultez votre utilisation actuelle dans Paramètres → Abonnement
- Découvrez la journalisation pour suivre les détails d'exécution
- Explorez l'API externe pour la surveillance programmatique des coûts
- Consultez les techniques d'optimisation des workflows pour réduire les coûts