Post

Dove trovare raccolte di dati (dataset) utilizzabili gratuitamente

Quando si entra nel fantastico mondo dell'analisi dei dati il primo ingrediente che serve sono... i dati. E le raccolte di dati diventano fondamentali anche in seguito quando, ad esempio, si vuole addestrare un modello di machine learning. In questa pagina annoto i siti dai quali è possibile scaricare gratuitamente e legalmente dataset curati di dati. Chiunque può contribuire segnalandone di nuovi nei commenti Meta Datasets . La pagina dei Datasets di Meta AI offre un'incredibile raccolta di dataset su larga scala e benchmark per l'addestramento, il test e la valutazione dei modelli di intelligenza artificiale. I dataset coprono vari ambiti come la segmentazione degli oggetti, modelli visione-linguaggio, ricostruzione 3D, equità algoritmica e traduzione automatica. Esempi includono il dataset SA-V per la segmentazione, FACET per valutare l'equità nei modelli visivi e Ego4D per la comprensione di video in prima persona. Tutti i dataset possono essere scaricati gratuita...

Introducing Gemma 3: The most capable model you can run on a single GPU or TPU - Google

Today, we're introducing Gemma 3, a collection of lightweight, state-of-the-art open models built from the same research and technology that powers our Gemini 2.0 models. These are our most advanced, portable and responsibly developed open models yet. They are designed to run fast, directly on devices — from phones and laptops to workstations — helping developers create AI applications, wherever people need them. Gemma 3 comes in a range of sizes (1B, 4B, 12B and 27B), allowing you to choose the best model for your specific hardware and performance needs. In this post, we'll explore Gemma 3's capabilities, introduce ShieldGemma 2, and share how you can join the expanding Gemmaverse. Read more:  https://blog.google/technology/developers/gemma-3/

Google ha creato i Titan: modelli IA con la “memoria simile al cervello umano” - DDay

Ricercatori di Google hanno pubblicato una ricerca riguardante "Titan”, una nuova architettura per gestire la memoria nei modelli di IA, affrontando i limiti dei Transformer tradizionali, specialmente nella gestione di contesti lunghi. La famiglia di modelli Titan introduce infatti una memoria (logica) neurale modulare capace di memorizzare, dimenticare e richiamare informazioni in modo adattivo , migliorando l'efficienza e la scalabilità su sequenze estremamente lunghe. Prima di parlare dei Titan è però importante stabilire un concetto importante sulla memoria logica che utilizzano: la memoria opera solo durante l'inferenza come un "sistema di apprendimento", ma non si aggiunge ai dati di training . Cioè, il modello non impara sempre più cose continuando a usarlo. La memoria è contestuale solo alla richieste della singola “chat” o alle successive comunque correlate a essa . Leggi tutto:  https://www.dday.it/redazione/51731/google-ha-creato-i-titan-modelli-ia-co...

Abbiamo bisogno di algoritmi ad hoc per allenare l'intelligenza - Wired

Il problema più rilevante che l’umanità sta affrontando è il confronto tra intelligenza umana e artificiale . Il tema è controverso e aperto: controverso perché ci sono posizioni opposte tra chi ritiene che l’intelligenza umana non potrà mai essere superata e chi invece sostiene esattamente il contrario; aperto perché può condurre a esiti imprevedibili in ogni direzione. Di sicuro non abbiamo maturato una coscienza dell’intelligenza artificiale , intesa come consapevolezza delle conseguenze che può comportare il suo sviluppo , che, come ricorda padre Paolo Benanti “ha bisogno di regole etiche” . Leggi tutto:  https://www.wired.it/article/intelligenza-artificiale-algoritmi-educativi-scuola/

Alternative a Yahoo Finance per scaricare i dati di borsa

Da qualche mese non è più possibile scaricare gratuitamente lo storico dei dati di borsa da Yahoo Finance. Una scelta comprensibile, dettata probabilmente dalla volontà di monetizzare i dati in loro possesso, ma che rappresenta una perdita per chi utilizza queste informazioni come campo di allenamento per attività di analisi dei dati. I dati di borsa sono, infatti, una delle risorse più versatili per esercitarsi in tutte le fasi del processo di analisi: dall’estrazione e pulizia dei dati, alla loro trasformazione, fino all’analisi di serie storiche e all’applicazione di tecniche previsionali, incluse quelle basate su machine learning. Yahoo Finance: un’opportunità perduta Fino a poco tempo fa, Yahoo Finance consentiva di accedere a dati storici su prezzi, dividendi e frazionamenti per una vasta gamma di titoli, con una profondità temporale che, in alcuni casi, arrivava agli ...

Qwen 2.5 Coder 32B è pronto a cambiare la vita (gratuitamente) a migliaia di sviluppatori - DDay

Qwen è il nome di una serie di modelli linguistici avanzati sviluppati da Alibaba Cloud, uno dei principali provider di cloud computing e intelligenza artificiale al mondo, e rilasciati in modalità opensource. Sono in poche parole la versione sviluppata da Alibaba di LLama, sviluppato da Facebook. Nel pacchetto di modelli Qwen è stato annunciato negli scorsi mesi Qwen2.5 Coder, un modello che come dice il nome stesso nasce con l’obiettivo di scrivere codice, completare codice e gestire eventuali errori con supporto a decine di diversi linguaggi di programmazione . Leggi tutto:  https://www.dday.it/redazione/51078/qwen-25-coder-32b-e-pronto-a-cambiare-la-vita-gratuitamente-a-migliaia-di-sviluppatori

E se l'intelligenza artificiale leggesse al nostro posto? - Wired

Negli ultimi anni abbiamo imparato a conoscere (e persino a giocare con) l’ intelligenza artificiale che scrive testi, crea immagini e anche canzoni basandosi sulle nostre più o meno accurate indicazioni. Ma cosa succederebbe - e che impatto avrebbe nelle nostre vite - se l’IA iniziasse a leggere e interpretare testi complessi in nostra vece? Dovremmo confrontarci con tematiche riguardanti la comprensione del testo , il deskilling umano, il riconoscimento o la perdita della voce autoriale e persino rivedere il processo di formazione delle idee . Leggi tutto:  https://www.wired.it/article/intelligenza-artificiale-legge-umani-intervista-naomi-susan-baron/

Translated presenta Lara, l'intelligenza artificiale che traduce meglio delle altre perché capisce il contesto - Wired

“La terra è rossa” . “The earth is red” . È la prima frase tradotta pubblicamente da Lara, il traduttore automatico più potente al mondo. Realizzato da Translated e alimentato dall'intelligenza artificiale, è disponibile online da lunedì 4 novembre. Il programma è stato realizzato da Translated , società fondata nel 1999 che unisce creatività umana e nuove tecnologie per realizzare rapidamente traduzioni attendibili. Il modello di intelligenza artificiale utilizzato è stato allenato in partnership con Nvidia e funziona grazie a una grande mole di dati (circa dieci miliardi di parole ) raccolti negli ultimi venticinque anni. Lara non solo trasferisce frasi ed espressioni da un idioma all’altro, ma spiega e comprende anche il contesto in cui una frase viene pronunciata e deve essere tradotta. Se non capisce immediatamente, si aggiunge una nota, come: "La terra è rossa perché siamo in un campo da tennis" . Ed ecco che “the earth” diventa "the court" . Leggi t...