Google corregge il tiro sui nuovi limiti di Gemini, dopo le proteste nate quando molti utenti hanno visto consumarsi le proprie quote molto più rapidamente del previsto.
Il problema riguarda il sistema introdotto dopo il Google I/O 2026, che non considera più soltanto il numero di richieste inviate ma anche il compute consumato da ogni prompt. Chat lunghe, file allegati e domande più complesse hanno finito così per pesare molto di più sulle quote disponibili, spingendo l’azienda ad annunciare alcune correzioni per rendere il meccanismo più comprensibile e meno penalizzante nell’uso quotidiano.
Il conteggio a compute e le quote che spariscono troppo in fretta
Il nuovo sistema, nelle intenzioni di Google, dovrebbe misurare meglio l’uso reale dei modelli. Non si guarda più soltanto a quante domande vengono fatte, ma a quanto pesa ogni singola operazione. Una richiesta breve a Gemini consuma poco. Un prompt più articolato, magari con documenti caricati, strumenti attivi o una conversazione già lunga alle spalle, può invece incidere parecchio sulla quota settimanale o mensile.
È proprio qui che sono nati i problemi. Nelle ore successive al lancio, diversi utenti hanno raccontato di aver visto calare il credito senza capire bene il motivo. C’è chi parla di quote scese dopo poche richieste considerate normali, chi dice di aver raggiunto il limite durante sessioni di lavoro tutt’altro che estreme. Più che una questione tecnica, un fastidio concreto. Senza indicazioni precise, infatti, diventa difficile capire quanto “costi” davvero una singola interazione con Gemini 3.1 Pro.
Tetto per Gemini 3.1 Pro, Flash-Lite gratuito ed errori non addebitati
La correzione più visibile riguarda Gemini 3.1 Pro. Google ha introdotto un tetto massimo di consumo per singolo prompt, così una richiesta particolarmente pesante non potrà più bruciare una fetta troppo ampia del limite disponibile. Josh Woodward, responsabile di Gemini, ha spiegato che l’obiettivo è permettere agli utenti di “ottenere di più dal modello Pro”. Una frase semplice, ma che fotografa bene il problema emerso nei primi giorni.
Novità anche per Gemini 3.1 Flash-Lite, il modello più leggero della famiglia. Le richieste gratuite non verranno più scalate dalla quota: una scelta pensata per chi usa Gemini per attività rapide, bozze, riassunti brevi o domande di tutti i giorni. Google ha chiarito anche un altro punto importante: se una richiesta fallisce per un errore di sistema, il consumo non sarà addebitato all’utente. “I nostri errori di sistema sono a nostro carico, non vostro”, ha scritto l’azienda, provando così a rispondere a una delle critiche più frequenti.
Deep Research, Omni e pannello usage: i dubbi ancora aperti
Restano però alcuni nodi. Le funzioni avanzate come Deep Research, che richiedono più elaborazione e tempi più lunghi, continueranno a pesare molto sulle quote. Google promette notifiche più chiare e dati d’uso più dettagliati, ma per ora il pannello disponibile su gemini.google.com/usage offre una panoramica piuttosto generale. Per chi lavora ogni giorno con questi strumenti, può non essere abbastanza.
C’è poi il caso delle generazioni Omni, i contenuti video creati con l’AI. Un bug, secondo quanto emerso, avrebbe svuotato la quota di alcuni utenti dopo uno o due risultati. Google sostiene di aver risolto il problema e, come compensazione, ha raddoppiato il numero di generazioni Omni per gli abbonati AI Ultra. Un altro aggiustamento riguarda la scelta del modello: Gemini ora ricorda quello selezionato tra una sessione e l’altra e passa a una versione più leggera solo quando un limite lo rende necessario.
La risposta rapida mostra che Google ha ascoltato le lamentele. Resta però l’impressione di un lancio gestito con poca cautela. Il sistema a compute può avere senso, soprattutto con modelli sempre più diversi tra loro. Ma deve essere chiaro. Altrimenti, per l’utente, la quota resta una scatola nera.