Anthropic rilascia Claude Fable 5: cosa succede adesso?
Anthropic ha rilasciato Claude Fable 5, il primo modello di classe Mythos disponibile a tutti. Cosa cambia per chi costruisce software e per le PMI.
Il 9 giugno Anthropic ha rilasciato Claude Fable 5, il primo modello della famiglia Claude 5 e il primo di quella che chiamano classe "Mythos" a essere reso disponibile al pubblico. Fino a ieri i modelli Mythos erano riservati a una manciata di partner fidati. Oggi chiunque abbia un abbonamento o un accesso API può usare il modello più potente che Anthropic abbia mai messo in circolazione.
Ho passato gli ultimi giorni a provarlo sui progetti veri — quelli dell'agenzia, non i benchmark — e voglio mettere in fila cosa significa questo rilascio. Perché la notizia non è "è uscito un modello più bravo". Quella ormai è routine. La notizia è come è uscito, a che prezzo, e cosa ci dice sulla direzione che sta prendendo tutto il settore.
Cosa è Fable 5, in concreto
Fable 5 è dichiaratamente lo stato dell'arte su quasi tutti i benchmark: ingegneria del software, knowledge work, visione, ricerca scientifica. Anthropic lo descrive come il modello più capace mai reso generalmente disponibile, e le prime prove indipendenti sembrano confermarlo.
Il dettaglio interessante è un altro: Fable 5 e Mythos 5 sono lo stesso modello sotto il cofano. La differenza sta nelle misure di sicurezza. Fable 5 esce con dei guardrail aggiuntivi che bloccano le risposte in aree ad alto rischio — cybersecurity offensiva e biologia su tutte. Quando una richiesta tocca quei territori, la risposta arriva da Claude Opus 4.8 al posto del modello di punta. Secondo Anthropic succede in meno del 5% delle sessioni.
Tradotto: Anthropic ha deciso che il modello era troppo capace per essere distribuito senza filtri, ma troppo prezioso per restare chiuso in un cassetto. La soluzione è un compromesso ingegneristico, non una rinuncia. E il fatto che il rilascio sia arrivato pochi giorni dopo che la stessa Anthropic aveva avvertito pubblicamente dei rischi crescenti dell'AI ha fatto discutere parecchio. TechCrunch ci ha titolato sopra, e capisco perché: c'è una tensione evidente tra il dire "questa tecnologia inizia a fare paura" e il metterla in vendita la settimana dopo.
Il prezzo dice più dei benchmark
Fable 5 costa 10 dollari per milione di token in input e 50 in output. È meno della metà di quanto costava Mythos in anteprima, ma resta molto più caro dei modelli Opus attuali. Fino al 22 giugno è incluso senza costi extra negli abbonamenti, poi si vedrà.
Questa struttura di prezzo racconta una cosa precisa: i modelli di punta non sono più per tutti i casi d'uso, e va bene così. Nessuno usa Fable 5 per riassumere una mail. Il modello top serve per i task dove la qualità del ragionamento sposta davvero il risultato — architettura software, analisi complesse, ricerca. Per tutto il resto ci sono modelli più piccoli, più veloci e più economici.
Chi costruisce prodotti sopra questi modelli — e io con QuickWise sono tra questi — deve ragionare esattamente in questi termini: quale task merita quale modello. Mandare tutto al modello più potente è il modo più rapido per bruciare marginalità.
Cosa cambia per chi costruisce software
La mia lettura da builder è questa: il vantaggio competitivo non sta più nell'accesso al modello. Quando il modello migliore del mondo è disponibile a chiunque con una carta di credito, avere "l'AI" smette di essere un differenziale. Lo era nel 2023, forse nel 2024. Oggi no.
Il differenziale si è spostato su tre cose, e nessuna delle tre è il modello:
La prima è il contesto. Un modello potentissimo che non conosce i tuoi dati, i tuoi processi e i tuoi clienti produce risposte generiche di altissima qualità — che è un modo elegante per dire inutili. Il lavoro vero sta nel portare il contesto giusto al modello giusto al momento giusto.
La seconda è l'integrazione nei processi. Lo vedo ogni settimana con i clienti dell'agenzia: la distanza tra "abbiamo provato ChatGPT" e "l'AI ci fa risparmiare venti ore al mese" non si colma con un modello migliore, si colma ridisegnando il processo attorno allo strumento.
La terza è il giudizio. Più i modelli diventano capaci, più diventa prezioso chi sa valutare cosa hanno prodotto. Fable 5 sbaglia meno dei predecessori, ma sbaglia con più sicurezza. Serve qualcuno che sappia distinguere.
Cosa cambia per le PMI
Se gestisci una PMI, la tentazione è pensare che questa notizia non ti riguardi: roba da sviluppatori, da San Francisco, da gente che parla di benchmark. Sbagliato, per un motivo molto pratico: ogni salto di capacità dei modelli abbassa la soglia di quello che conviene automatizzare.
Compiti che due anni fa richiedevano un progetto software dedicato — leggere documenti non strutturati, rispondere a richieste clienti articolate, estrarre dati da fonti eterogenee — oggi si risolvono con una integrazione ben fatta sopra un modello di frontiera. Il costo di automatizzare scende a ogni rilascio, mentre il costo di non automatizzare resta dov'è. Quel divario, composto su anni, è la differenza tra chi compete e chi insegue.
Non serve correre dietro a ogni rilascio. Serve avere qualcuno — interno o esterno — che ogni sei mesi si chieda: cosa è diventato possibile che sei mesi fa non lo era? Quella domanda, fatta con costanza, vale più di qualsiasi abbonamento premium.
Il dibattito sulla sicurezza non è teatro
Vale la pena spendere due parole sul contesto, perché il rilascio di Fable 5 è arrivato in un momento particolare. Anthropic aveva appena dichiarato pubblicamente che le capacità dei nuovi modelli stavano diventando pericolose in alcune aree specifiche, e pochi giorni dopo ha messo in commercio proprio uno di quei modelli, sia pure con i guardrail. The Register ha già documentato i primi casi in cui i filtri scattano su richieste innocue, e c'è chi grida alla censura, chi all'ipocrisia commerciale.
La mia posizione è meno emotiva: i guardrail imperfetti sono il prezzo prevedibile di una scelta di fondo che condivido, cioè distribuire la capacità con dei limiti invece di tenerla chiusa o liberarla senza filtri. Per chi lavora, l'impatto pratico del falso positivo occasionale è marginale — meno del 5% delle sessioni, e su task aziendali tipici praticamente mai. Ma è un tema da monitorare, perché ci dice come si comporterà tutto il settore da qui in avanti: i modelli di frontiera arriveranno sempre più spesso "depotenziati" in aree specifiche, e bisognerà imparare a conviverci.
Cosa farei questa settimana
Se vuoi trasformare questa notizia in qualcosa di utile invece che in una lettura, ecco il percorso che suggerisco — è quello che sto seguendo io.
Primo: approfitta della finestra. Fino al 22 giugno Fable 5 è incluso negli abbonamenti senza costi extra. È il momento giusto per fare benchmark sui tuoi casi d'uso reali, non sulle demo: prendi tre task che oggi fai con il tuo modello abituale e confronta i risultati.
Secondo: misura il delta, non la meraviglia. La domanda non è "è impressionante?" — lo è sempre. La domanda è: su questo specifico task, la differenza di qualità giustifica la differenza di prezzo? Per la maggior parte dei task quotidiani la risposta sarà no, ed è un'informazione preziosa quanto il suo contrario.
Terzo: identifica il task di frontiera. In ogni azienda c'è almeno un'attività che finora l'AI non riusciva a fare abbastanza bene da essere utile — quel documento troppo complesso, quell'analisi troppo articolata. È lì che un salto di capacità cambia le carte: riprova oggi quello che sei mesi fa avevi scartato.
E adesso?
Adesso succede quello che succede sempre: per qualche settimana si parlerà di benchmark e demo spettacolari, poi l'attenzione si sposterà sul prossimo rilascio di OpenAI o Google, perché la rincorsa non si ferma. Nel frattempo, sotto il rumore, chi lavora bene continuerà a fare la cosa noiosa e redditizia: prendere questi modelli e cucirli dentro processi reali, misurando i risultati.
Fable 5 è un attrezzo straordinario. Ma resta un attrezzo. La domanda giusta non è "quanto è potente?", è "cosa ci costruisco?". Io qualche idea ce l'ho, e nelle prossime settimane la racconterò qui sul blog.
Fonti: Anthropic, TechCrunch, VentureBeat, The Decoder, CNBC