Cloud Temple

Cycle de vie des modèles

Planification, dates de support et migrations des modèles LLMaaS

31

modèles en production

7

modèles LTS

1

fin de support < 6 mois

0

avec migration conseillée

ModèlePhaseDMPDSPLTSMigration conseilléeContexte (num_ctx)
devstral-small-2:24bProduction02/02/2026
30/09/2026105 j restants
200 000
functiongemma:270mProduction30/12/2025
30/12/2026196 j restants
32 768
gemma4:12b-it-qatProduction01/06/2026
30/12/2026196 j restants
250 000
gemma4:31bProduction16/04/2026
30/12/2026196 j restants
250 000
mistral-small4:119bProduction13/05/2026
30/12/2026196 j restants
262 144
nemotron-3-super:120bProduction31/03/2026
30/12/2026196 j restants
1 000 000
qwen-coder-next:80bProduction04/02/2026
30/12/2026196 j restants
250 000
qwen3-next:80bProduction02/02/2026
30/12/2026196 j restants
250 000
qwen3-vl:235bProduction04/01/2026
30/12/2026196 j restants
200 000
qwen3-vl:30bProduction30/12/2025
30/12/2026196 j restants
250 000
qwen3-vl:4bProduction30/12/2025
30/12/2026196 j restants
250 000
qwen3.6:27bProduction01/04/2026
30/12/2026196 j restants
1 000 000
qwen3.6:35bProduction22/04/2026
30/12/2026196 j restants
1 000 000
translategemma:27bProduction22/01/2026
30/12/2026196 j restants
120 000
granite4.1-guardian:8bProduction13/06/2026
30/12/2026196 j restants
8 192
qwen3-embedding:0.6bProduction14/05/2026
30/12/2026196 j restants
40 000
qwen3-embedding:4bProduction14/05/2026
30/12/2026196 j restants
40 000
qwen3-embedding:8bProduction14/05/2026
30/12/2026196 j restants
40 000
voxtralProduction16/02/2026
30/12/2026196 j restants
32 768
x/z-image-turbo:latestProduction01/02/2026
30/12/2026196 j restants
0
BAAI/bge-reranker-largeProduction13/05/2026
30/06/2027378 j restants
512
nvidia/llama-nemotron-rerank-vl-1b-v2Production07/05/2026
30/06/2027378 j restants
4 096
Qwen/Qwen3-Reranker-0.6BProduction13/05/2026
30/06/2027378 j restants
4 096
Qwen/Qwen3-Reranker-4BProduction13/05/2026
30/06/2027378 j restants
4 096
bge-m3:567mProduction18/10/2025
30/12/2027561 j restants
LTS8 192
embeddinggemma:300mProduction10/09/2025
30/12/2027561 j restants
LTS2 048
gpt-oss:120bProduction11/11/2025
30/12/2027561 j restants
LTS120 000
granite-embedding:278mProduction13/06/2025
30/12/2027561 j restants
LTS512
llama3.3:70bProduction13/06/2025
30/12/2027561 j restants
LTS132 000
qwen3:235bProduction04/01/2026
30/12/2027561 j restants
LTS200 000
qwen3-2507-think:4bProduction31/08/2025
30/12/2027561 j restants
LTS250 000

Légende

< 50 % du cycle écoulé
50–70 % du cycle écoulé
70–90 % du cycle écoulé
> 90 % du cycle écoulé

DMP = Date de Mise en Production

DSP = Date de Sortie de Production (fin de support)

LTS = Long Term Support — support étendu garanti

num_ctx = Taille maximale du contexte (en tokens)