Questo articolo è stato compilato da un programma WeChat: Crypto Cloud Travel
Nell'estate del 1858, un cavo di rame attraversava il fondo dell'Atlantico, collegando Londra e New York.
Il significato di questo non risiede mai nella velocità di trasmissione, ma nella struttura del potere: chi ha posato i cavi sottomarini può trarre profitto dal flusso di informazioni. L'Impero Britannico si è basato su questa rete globale di telegrafi per controllare le informazioni, i prezzi del cotone e le notizie di guerra delle colonie.
La potenza di un impero non risiede solo nella sua flotta, ma anche in quel cavo.
Dopo centosessant'anni, questa logica si sta ripetendo in un modo inaspettato.
Nel 2026, i grandi modelli cinesi stanno silenziosamente conquistando il mercato globale degli sviluppatori. I dati più recenti di OpenRouter mostrano che, nel consumo di Token dei primi dieci modelli della piattaforma, i modelli cinesi detengono il 61%, e i primi tre sono tutti cinesi. Le richieste API inviate dagli sviluppatori di San Francisco, Berlino e Singapore attraversano i cavi sottomarini del Pacifico per raggiungere i data center in Cina, dove la potenza di calcolo viene utilizzata e l'elettricità fluisce, con i risultati che vengono restituiti.
L'elettricità non ha mai lasciato la rete elettrica cinese, ma il suo valore è stato consegnato oltre confine tramite Token.
La grande migrazione dei modelli AI
Il 24 febbraio 2026, OpenRouter ha pubblicato un rapporto settimanale: il consumo totale di Token dei primi dieci modelli della piattaforma è di circa 87 trilioni, con i modelli cinesi che detengono 53 trilioni, pari al 61%. MiniMax M2.5 è atterrato al primo posto con 24,5 trilioni di Token, seguito da Kimi K2.5 e Zhipu GLM-5, tutti e tre provenienti dalla Cina.

I dati più recenti del 26 febbraio
Non è una coincidenza; una miccia ha acceso tutto.
All'inizio di quest'anno, OpenClaw è stato lanciato, uno strumento open source che ha davvero iniziato a "lavorare" per l'AI, in grado di controllare direttamente il computer, eseguire comandi e completare flussi di lavoro complessi in parallelo, con il numero di stelle su GitHub che ha superato 210.000 in poche settimane.
John, un professionista finanziario, ha installato OpenClaw per primo e ha integrato l'API di Anthropic, iniziando a monitorare automaticamente le informazioni del mercato azionario e a riportare tempestivamente segnali di trading; alcune ore dopo, ha fissato il saldo del suo conto con stupore: decine di dollari, spariti.
Questa è la nuova realtà portata da OpenClaw. In passato, interagire con l'AI significava utilizzare migliaia di Token per una conversazione, un costo trascurabile. Dopo l'integrazione di OpenClaw, l'AI esegue simultaneamente dozzine di sotto-compiti in background, richiamando contesti e iterando ciclicamente; il consumo di Token non è lineare, è esponenziale. La bolletta sembra un'auto che accelera con il cofano aperto, il livello del carburante scende e non si ferma.
Nel community degli sviluppatori, è emersa una "scorciatoia": utilizzare un token OAuth per connettere direttamente gli account di abbonamento di Anthropic o Google a OpenClaw, trasformando il limite "illimitato" a pagamento mensile in un combustibile gratuito per l'AI Agent, un metodo adottato da molti sviluppatori.
La risposta ufficiale è arrivata subito.
Anthropic ha aggiornato il protocollo il 19 febbraio, vietando esplicitamente l'uso dei credenziali di abbonamento a Claude in strumenti di terze parti come OpenClaw; per accedere alle funzionalità di Claude, è necessario utilizzare il canale di fatturazione API. Google ha inoltre bloccato su larga scala gli account di abbonamento che si collegano a Antigravity e Gemini AI Ultra tramite OpenClaw.
"Il mondo sta soffrendo per Qin da tempo", Jhon si è subito gettato tra le braccia dei grandi modelli domestici.
Su OpenRouter, il grande modello domestico MiniMax M2.5 ha ottenuto un punteggio dell'80,2% nei compiti di ingegneria del software, mentre Claude Opus 4.6 ha ottenuto un punteggio dell'80,8%, con una differenza praticamente trascurabile. Ma i prezzi sono drasticamente diversi: il primo costa 0,3 dollari ogni milione di Token, il secondo 5 dollari, con una differenza di circa 17 volte.
John ha cambiato flusso, e il lavoro continua a funzionare, la bolletta è diminuita di un ordine di grandezza, questa migrazione sta avvenendo in tutto il mondo.
Chris Clark, COO di OpenRouter, ha dichiarato apertamente che i modelli open source cinesi sono riusciti a guadagnare una grande quota di mercato perché hanno una quota eccezionalmente alta nei flussi di lavoro degli agenti eseguiti dagli sviluppatori americani.
L'elettricità all'estero
Per comprendere la vera essenza dell'uscita dei Token, è necessario prima chiarire la struttura dei costi di un Token.
Sembra leggero, un Token è circa equivalente a 0,75 parole inglesi; una normale conversazione con l'AI consuma solo poche migliaia di Token. Ma quando questi Token si accumulano in trilioni, la realtà fisica dietro diventa pesante.
Analizzando i costi dei Token, ci sono solo due elementi fondamentali: potenza di calcolo e elettricità.
La potenza di calcolo è l'ammortamento delle GPU; se compri una Nvidia H100, spendi circa trentamila dollari, e la sua vita utile si traduce in un costo di ammortamento per ogni inferenza. L'elettricità è il combustibile per il funzionamento continuo dei data center; una GPU a pieno carico consuma circa 700 watt, e con i costi del sistema di raffreddamento, la bolletta elettrica di un grande data center AI può facilmente superare i centinaia di milioni di dollari all'anno.
Ora, disegna questo processo fisico sulla mappa.
Un sviluppatore americano invia una richiesta API da San Francisco. I dati partono dalla California, attraversano i cavi sottomarini del Pacifico per raggiungere un data center in Cina, dove i cluster di GPU iniziano a lavorare, l'elettricità fluisce dalla rete elettrica cinese verso quei chip, l'inferenza viene completata e i risultati vengono restituiti. L'intero processo può richiedere solo uno o due secondi.
L'elettricità non ha mai lasciato la rete elettrica cinese, ma il valore dell'elettricità, attraverso i Token, ha completato la consegna oltre confine.
C'è una magia qui che un normale commercio non può raggiungere: i Token non hanno forma, non devono passare attraverso la dogana, non vengono colpiti da dazi e non rientrano nemmeno in nessuna statistica commerciale attuale. La Cina ha esportato enormi quantità di potenza di calcolo e servizi elettrici, ma nei dati ufficiali sul commercio di beni, è praticamente invisibile.
I Token sono diventati un derivato dell'elettricità, e l'uscita dei Token è essenzialmente l'uscita dell'elettricità.
Questo è anche dovuto ai prezzi relativamente bassi dell'elettricità in Cina, con un prezzo medio dell'elettricità circa il 40% più basso rispetto agli Stati Uniti, una differenza di costo a livello fisico, facilmente replicabile dai concorrenti.
Inoltre, i grandi modelli AI cinesi hanno anche vantaggi algoritmici e di "involuzione".
L'architettura MoE di DeepSeek V3 attiva solo alcuni parametri durante l'inferenza; test indipendenti mostrano che i suoi costi di inferenza sono circa 36 volte inferiori a quelli di GPT-4o, mentre MiniMax M2.5 ha 229 miliardi di parametri totali, attivando solo 10 miliardi.
Il livello superiore è l'involuzione, con aziende come Alibaba, ByteDance, Baidu, Tencent, Dark Moon, Zhipu, MiniMax… una dozzina di aziende che si schiacciano l'una sull'altra nello stesso campo, con prezzi che sono già scesi al di sotto della soglia di profitto ragionevole, perdite e guadagni sono già la norma nel settore.
Dando un'occhiata più da vicino, è simile all'uscita dei prodotti manifatturati dalla Cina, che utilizzano vantaggi della catena di approvvigionamento e involuzione del settore per abbattere drasticamente i prezzi dei Token.
Da Bitcoin a Token
Prima dei Token, c'è stata un'altra uscita di elettricità.
Circa nel 2015, i gestori delle centrali elettriche in Sichuan, Yunnan e Xinjiang hanno iniziato a ricevere una serie di ospiti strani.
Queste persone affittano fabbriche abbandonate, riempiendole di macchine, funzionanti 24 ore su 24. Le macchine non producono nulla, ma continuano a risolvere un problema matematico, e ogni tanto, riescono a calcolare un Bitcoin da quel problema matematico infinito.
Questa è la prima generazione di uscita dell'elettricità: convertire l'elettricità idroelettrica e eolica a basso costo in asset digitali di circolazione globale tramite calcoli hash delle macchine minerarie, e poi monetizzarli in dollari nelle borse.
L'elettricità non ha attraversato alcun confine, ma il valore dell'elettricità, veicolato da Bitcoin, è fluito verso il mercato globale.
In quegli anni, la potenza di calcolo della Cina ha rappresentato oltre il 70% del mining di Bitcoin globale. L'elettricità idroelettrica e quella a carbone della Cina ha partecipato a una redistribuzione globale del capitale in questo modo indiretto.
Nel 2021, tutto si è bruscamente fermato. I colpi della regolamentazione sono arrivati, i minatori si sono disperdati, la potenza di calcolo è migrata in Kazakistan, Texas negli Stati Uniti e Canada.
Ma questa logica non è mai scomparsa, stava solo aspettando un nuovo involucro, fino a quando ChatGPT non è emerso, portando a una competizione tra grandi modelli, e le ex miniere di Bitcoin si sono trasformate in data center per l'AI, dove le macchine minerarie sono diventate GPU, e i Bitcoin precedentemente prodotti sono diventati Token, mentre l'elettricità è rimasta invariata.
L'uscita del Bitcoin e dei Token è logicamente isomorfa, ma i Token hanno attualmente un valore commerciale maggiore.
Il mining di criptovalute è un calcolo matematico puramente matematico; il Bitcoin prodotto è un asset finanziario il cui valore deriva dalla scarsità e dal consenso di mercato, non ha nulla a che fare con "cosa è stato calcolato". La potenza di calcolo di per sé non ha produttività, è più simile a un sottoprodotto di un meccanismo di fiducia.
L'inferenza dei grandi modelli è diversa. Le GPU consumano elettricità, e ciò che producono sono servizi cognitivi reali: codice, analisi, traduzioni, creatività. Il valore dei Token deriva direttamente dalla loro utilità per gli utenti. Si tratta di un'integrazione più profonda; una volta che il flusso di lavoro degli sviluppatori si basa su un certo modello, il costo del passaggio diventa più alto nel tempo.
Naturalmente, c'è anche una differenza chiave: il mining di Bitcoin è stato espulso dalla Cina, mentre l'uscita dei Token è una scelta attiva da parte degli sviluppatori globali.
Guerra dei Token
Il cavo sottomarino posato nel 1858 rappresenta la sovranità dell'Impero Britannico sull'autostrada dell'informazione; chi possiede l'infrastruttura può definire le regole del gioco.
L'uscita dei Token è anch'essa una guerra senza dichiarazione di guerra, con molte resistenze.
La sovranità dei dati è il primo muro; una richiesta API di uno sviluppatore americano è elaborata tramite un data center cinese, e i dati fisicamente passano attraverso la Cina. Per gli sviluppatori individuali e le piccole applicazioni, non è un problema, ma in scenari che coinvolgono dati sensibili per le imprese, informazioni finanziarie e conformità governativa, è un grosso problema. Ecco perché la penetrazione dei modelli cinesi è più alta negli strumenti di sviluppo e nelle applicazioni personali, mentre è quasi assente nei sistemi core aziendali.
Il divieto sui chip è il secondo muro; lo sviluppo dell'AI in Cina affronta il controllo delle esportazioni delle GPU di alta gamma di Nvidia, e l'architettura MoE e l'ottimizzazione degli algoritmi possono solo parzialmente compensare questo svantaggio, il tetto rimane.
Ma la resistenza attuale è solo un prologo, un campo di battaglia molto più grande si sta formando.
I Token e i modelli AI sono diventati una nuova dimensione della competizione strategica tra Cina e Stati Uniti, paragonabile ai semiconduttori e a Internet del ventesimo secolo, e persino più vicina a una metafora più antica: la corsa spaziale.
Nel 1957, l'Unione Sovietica lanciò il Sputnik 1, sorprendente l'America, che subito avviò il programma Apollo, investendo risorse pari a migliaia di miliardi di dollari attuali per non perdere nella corsa spaziale.
La logica della competizione per l'AI è sorprendentemente simile, ma l'intensità sarà molto superiore a quella della corsa spaziale. Lo spazio è pur sempre uno spazio fisico, che le persone comuni non possono percepire, mentre l'AI penetra nei capillari dell'economia; ogni linea di codice, ogni contratto, ogni sistema di decisione governativa potrebbe essere alimentato da un grande modello di un paese. Chiunque diventi l'opzione predefinita per l'infrastruttura degli sviluppatori globali avrà un'influenza strutturale invisibile sull'economia digitale globale.
Questo è proprio il motivo per cui l'uscita dei Token dalla Cina fa sentire Washington veramente inquieta.
Quando il codice, il flusso di lavoro dell'Agente e la logica del prodotto di uno sviluppatore sono costruiti attorno all'API di un modello cinese, i costi di migrazione aumenteranno esponenzialmente nel tempo. A quel punto, anche se ci sono limitazioni legislative negli Stati Uniti, gli sviluppatori resisteranno, proprio come oggi nessun programmatore può abbandonare GitHub.
L'uscita dei Token di oggi potrebbe essere solo l'inizio di una lunga battaglia. I grandi modelli cinesi non dichiarano di voler sovvertire nulla; stanno solo offrendo servizi a un prezzo molto più basso a ogni sviluppatore con una chiave API nel mondo.
Questa volta, i cavi sono stati posati da team di ingegneri che scrivono codice a Hangzhou, Pechino e Shanghai, e dai cluster di GPU che operano giorno e notte in una provincia del sud.
Questa competizione non ha un countdown; si svolge 24 ore su 24, con unità di Token, e il campo di battaglia è il terminale di ogni sviluppatore.#加密市场反弹 $BTC