Scott Wu di Cognition afferma che gli agenti di programmazione basati sull'intelligenza artificiale non dovrebbero sostituire gli esseri umani ↗
Scott Wu di Cognition ha respinto l'idea che Devin sia stato creato per sostituire completamente i programmatori. Una posizione alquanto scomoda, visto che l'azienda afferma anche che Devin contribuisce con una grande quantità di codice proprietario.
La sua impostazione è più simile a "un compagno di programmazione per l'IA" che a "il tuo lavoro è stato divorato da un folletto del portatile". Eppure, la tensione è difficile da ignorare: agenti migliori, meno scuse per team di ingegneri gonfiati... o almeno così recita la tesi.
Questa startup basata sull'intelligenza artificiale pulirà gratuitamente la tua casa per addestrare i futuri robot ↗
Shift offre pulizie domestiche gratuite, con un piccolo inconveniente, al contempo pratico e vagamente inquietante: gli addetti alle pulizie indossano un "cappello magico" dotato di telecamera, in modo che l'azienda possa raccogliere dati per l'addestramento dei robot.
La proposta è semplice: tu ottieni un appartamento pulito, loro un video delle faccende domestiche. Un affare, forse.
Shift afferma di sfocare i dettagli sensibili e di anonimizzare i filmati, ma la domanda fondamentale rimane lì, come un calzino sotto il divano: quanta privacy domestica sono disposte a sacrificare le persone in cambio della comodità?
Anthropic lancia Claude Opus 4.8 ↗
Anthropic ha rilasciato Claude Opus 4.8 con aggiornamenti che riguardano la codifica, i flussi di lavoro degli agenti, il ragionamento e il lavoro professionale. Il punto di forza principale è l'affidabilità: meno affermazioni non supportate, un migliore utilizzo degli strumenti e una maggiore capacità di autoverifica.
Claude Code offre anche flussi di lavoro dinamici, consentendo al modello di pianificare, avviare sub-agenti in parallelo, verificare i risultati e generare report. Può sembrare un concetto arido, finché non ci si rende conto che si tratta fondamentalmente di gestione di progetti in un ambiente informale.
La distinzione tra prezzi standard e veloci rimane invariata, con Anthropic che punta maggiormente sul controllo dello sforzo, consentendo agli utenti di trovare un compromesso tra velocità, qualità e consumo di token.
Foxconn ripone un'enorme fiducia nella spinta di crescita derivante dall'intelligenza artificiale, afferma il presidente ↗
Il presidente di Foxconn ha affermato che la domanda di intelligenza artificiale sta modificando il consueto ritmo stagionale dell'azienda. Il vecchio calo di domanda dei fornitori a metà anno? A quanto pare, non si verifica più regolarmente.
Il motivo risiede negli ingenti investimenti in intelligenza artificiale dei giganti del cloud, che Foxconn vede come una vera e propria opportunità di mercato. Si tratta del lato hardware del boom dell'IA, meno appariscente dei chatbot, ma dove si concentrano la maggior parte degli investimenti.
Foxconn è già un importante produttore di server Nvidia, quindi il suo ottimismo rappresenta sostanzialmente un indicatore dello stato di avanzamento della corsa alle infrastrutture per l'intelligenza artificiale.
Un manuale condiviso per valutazioni affidabili da parte di terzi ↗
OpenAI ha pubblicato delle linee guida sulle valutazioni dell'IA da parte di terzi, sostenendo che i test necessitano di maggiori dettagli su cosa è stato valutato, come è stato testato e cosa possono dimostrare i risultati.
Il punto cruciale è sorprendentemente pratico: le valutazioni dell'IA di frontiera non possono basarsi solo su classifiche e supposizioni. I valutatori devono spiegare il sistema testato, le istruzioni, le misure di sicurezza, i controlli di validità e dove finiscono le affermazioni.
Questo è importante perché, man mano che i modelli diventano più complessi e dotati di agenti, i test superficiali possono far apparire i sistemi più sicuri o più robusti di quanto non siano in realtà. Poca energia burocratica, grandi conseguenze.
Domande frequenti
Gli agenti di programmazione basati sull'intelligenza artificiale come Devin sono destinati a sostituire i programmatori?
Scott Wu descrive gli agenti di programmazione basati sull'IA come partner di programmazione piuttosto che come sostituti completi dei programmatori umani. L'articolo, tuttavia, evidenzia una contraddizione: Devin viene anche descritto come colui che contribuisce in modo significativo alla stesura del codice di Cognition. In termini pratici, la conclusione è che questi strumenti potrebbero ridurre alcune attività di ingegneria di routine, pur dipendendo ancora dagli esseri umani per quanto riguarda giudizio, direzione e responsabilità.
Perché Shift offre pulizie domestiche gratuite in cambio di dati di addestramento per l'IA?
Shift offre pulizie domestiche gratuite perché desidera raccogliere dati video reali sulle faccende domestiche per addestrare i futuri robot. Gli addetti alle pulizie indossano un "cappello magico" dotato di telecamera durante il lavoro, producendo filmati che possono aiutare i sistemi di intelligenza artificiale a comprendere le attività domestiche. Lo scambio è chiaro: i clienti ottengono una casa pulita, mentre l'azienda raccoglie dati dagli spazi abitativi privati.
Come gestisce Shift la privacy durante la raccolta di filmati relativi alle pulizie domestiche?
L'articolo afferma che Shift sostiene di oscurare i dettagli sensibili e di anonimizzare i filmati. Ciò potrebbe ridurre alcuni rischi per la privacy, ma non elimina la preoccupazione più ampia relativa alle registrazioni all'interno delle case delle persone. Per gli utenti, la questione centrale è se la comodità di un servizio di pulizia gratuito giustifichi un tale livello di raccolta dati.
Quali sono le novità di Claude Opus 4.8?
Claude Opus 4.8 viene descritto come un sistema che migliora la codifica, i flussi di lavoro degli agenti, il ragionamento e il lavoro professionale. L'aggiornamento si concentra sull'affidabilità, includendo un minor numero di affermazioni non supportate, un utilizzo più efficace degli strumenti e una maggiore autoverifica. Claude Code acquisisce inoltre flussi di lavoro dinamici, in cui il modello può pianificare, eseguire sub-agenti in parallelo, verificare gli output e riportare i risultati.
Perché l'ottimismo di Foxconn riguardo al boom dell'intelligenza artificiale è importante?
La fiducia di Foxconn è importante perché riflette il lato hardware del boom dell'IA. Il presidente dell'azienda ha affermato che la domanda di IA sta cambiando il suo consueto andamento stagionale, con la spesa per le infrastrutture dei giganti del cloud che crea un'importante opportunità di mercato. Dato che Foxconn è già un importante produttore di server Nvidia, le sue dichiarazioni rappresentano un segnale forte per la domanda di infrastrutture per l'IA.
Cosa afferma OpenAI che rende affidabili le valutazioni di terze parti sull'intelligenza artificiale?
OpenAI sostiene che le valutazioni dell'IA necessitano di spiegazioni più chiare su quale sistema sia stato testato, come sia stato testato e cosa dimostrino realmente i risultati. Ciò include dettagli su istruzioni, misure di sicurezza, verifiche di validità e limiti di qualsiasi affermazione. Il punto è particolarmente importante per i modelli più agentivi, dove test superficiali possono far apparire i sistemi più sicuri o più capaci di quanto non siano in realtà.