Post

Dove trovare raccolte di dati (dataset) utilizzabili gratuitamente

Quando si entra nel fantastico mondo dell'analisi dei dati il primo ingrediente che serve sono... i dati. E le raccolte di dati diventano fondamentali anche in seguito quando, ad esempio, si vuole addestrare un modello di machine learning. In questa pagina annoto i siti dai quali è possibile scaricare gratuitamente e legalmente dataset curati di dati. Chiunque può contribuire segnalandone di nuovi nei commenti Meta Datasets . La pagina dei Datasets di Meta AI offre un'incredibile raccolta di dataset su larga scala e benchmark per l'addestramento, il test e la valutazione dei modelli di intelligenza artificiale. I dataset coprono vari ambiti come la segmentazione degli oggetti, modelli visione-linguaggio, ricostruzione 3D, equità algoritmica e traduzione automatica. Esempi includono il dataset SA-V per la segmentazione, FACET per valutare l'equità nei modelli visivi e Ego4D per la comprensione di video in prima persona. Tutti i dataset possono essere scaricati gratuita

Il lavoro impossibile dei sondaggisti statunitensi - Internazionale

All’inizio del novecento, prima delle elezioni presidenziali la rivista Literary Digest inviava ai lettori schede elettorali campione, chiedendogli di mandarle indietro compilate. Era uno dei primi sondaggi condotti su scala nazionale, rudimentale ma apparentemente efficace. Con questo metodo la rivista riuscì a prevedere il vincitore di cinque elezioni presidenziali, dal 1916 al 1932. Ma nel 1936, quando si sfidavano il presidente Franklin D. Roosevelt e il repubblicano Alf Landon, qualcosa andò storto. Il Digest inviò dieci milioni di schede elettorali ricevendone indietro 2,4 milioni, un tasso di risposta molto alto. Sulla base di quelle schede, il giornale predisse che Roosevelt avrebbe preso solo il 41 per cento dei voti, una batosta epocale. Il presidente vinse invece con il 61 per cento dei consensi, conquistando tutti gli stati tranne due, in una delle elezioni meno incerte della storia statunitense. Leggi tutto:  https://www.internazionale.it/notizie/alessio-marchionna/2024/1

L’intelligenza artificiale generale ha rotto - Wired

Ogni giorno esce almeno un articolo in cui si parla dell’ intelligenza artificiale generale come di una prospettiva realistica. Potrebbe sembrare un modo per aiutare il pubblico a chiarirsi le idee sull’evoluzione della più affascinante tra le nuove tecnologie. In realtà, si sta facendo un lavoro completamente diverso: quello di megafono dei colossi della Silicon Valley e dei loro interessi economici e politici. L’intelligenza artificiale generale non esiste , è molto improbabile che venga conquistata in un prossimo futuro e non è nemmeno chiaro se mai si riuscirà in questa impresa. E allora perché se ne parla così tanto? Perché sembra una prospettiva non solo inevitabile, ma addirittura destinata a concretizzarsi nel giro di qualche anno? Leggi tutto: https://www.wired.it/article/intelligenza-artificiale-generale-ricerca-miti/

Cos'è jupiter e quali sono le somiglianze e le differenze con kaggle?

Jupyter e Kaggle sono due strumenti importanti per chi lavora con la programmazione, l'analisi dei dati e il machine learning, ma hanno scopi e caratteristiche differenti: Jupyter Notebook Jupyter è un ambiente open-source che permette di creare e condividere documenti interattivi chiamati notebook , usati per scrivere e eseguire codice, documentare progetti e visualizzare i risultati (grafici, tabelle, ecc.). È molto flessibile, supporta diversi linguaggi (Python, R, Julia) e viene installato in locale o su server (usando JupyterLab per progetti più complessi). Sito:  https://jupyter.org/ Kaggle Kaggle è una piattaforma online per competizioni di data science, con un ambiente integrato di notebook e dataset. Permette agli utenti di scrivere codice, partecipare a competizioni di machine learning, accedere a dataset pubblici e collaborare con altri data scientist. A differenza di Jupyter, Kaggle fornisce accesso diretto a risorse di calcolo, come GPU e TPU, senza configura

RAG, cosa significa e a cosa serve?

"La RAG fornisce un modo per ottimizzare la produzione di un LLM con informazioni mirate senza modificare il modello alla sua base; quelle informazioni mirate possono essere più aggiornate rispetto al LLM, ma anche più precise nel caso di organizzazioni e settori specifici. Ciò significa che il sistema di intelligenza artificiale generativa può fornire risposte più appropriate ai prompt, e basare tali risposte su dati estremamente attuali." Fonte: Oracle - Che cos'è la Retrieval-Augmented Generation (RAG)? "La Retrieval-Augmented Generation (RAG) è il processo di ottimizzazione dell'output di un modello linguistico di grandi dimensioni, in modo che faccia riferimento a una base di conoscenza autorevole al di fuori delle sue fonti di dati di addestramento prima di generare una risposta. I modelli linguistici di grandi dimensioni (LLM) vengono addestrati su vasti volumi di dati e utilizzano miliardi di parametri per generare output originali per attività come risp

Un quarto del codice dei prodotti Google viene ora scritto dall’IA - DDay

Il CEO di NVIDIA lo aveva anticipato nei mesi scorsi: ci sarà sempre meno futuro per i programmatori perché l’ IA è molto più brava, efficiente e ovviamente economica nello scrivere codice . Non è ovviamente perfetta, ed è questo il motivo per il quale tutto il codice viene rivisto e revisionato dai software engineer prima di essere integrato con la codebase esistente, ma migliora con il passare del tempo e molte figure “junior” verrano sostituite. È già successo in Google, dove per ammissione del CEO Sundar Pichai Google sta utilizzando l'IA nella creazione di questi prodotti. "Più di un quarto di tutto il nuovo codice in Google è generato dall'IA, poi revisionato e accettato dagli ingegneri" , ha dichiarato Pichai durante la chiamata sugli utili del terzo trimestre 2024 dell'azienda. Sottolineando quanto l’IA sia fondamentale per Google, sia nei prodotti sia nello sviluppo dei prodotti. Leggi tutto:  https://www.dday.it/redazione/50934/un-quarto-del-codice-dei

Anthropic, la sua AI può prendere il controllo di un computer - Wired

C'è voluto un po' di tempo prima che le persone si abituassero all'idea di chatbot che sembrano avere una mente propria . Il prossimo salto nell'ignoto potrebbe essere quello di affidare all'intelligenza artificiale anche il controllo dei nostri computer . Anthropic , un concorrente di alto livello di OpenAI, ha annunciato di aver insegnato al suo modello di intelligenza artificiale Claude a eseguire una serie di operazioni su un computer , tra cui la ricerca sul web , l' apertura di applicazioni e l' inserimento di testo con il mouse e la tastiera. "Stiamo per entrare in una nuova era in cui un modello può utilizzare tutti gli strumenti come fanno le persone per svolgere i propri compiti " , afferma Jared Kaplan, responsabile scientifico di Anthropic e professore associato alla Johns Hopkins University. Leggi tutto: https://www.wired.it/article/anthropic-ai-claude-prendere-controllo-computer/

Tecniche di prompting (da Internazionale)

 Come aggirare i limiti imposti dai programmi di intelligenza artificiale I modelli di intelligenza artificiale che generano linguaggio umano, dopo essere stati addestrati, testati e raffinati, di solito passano attraverso una fase di ulteriore miglioramento che prevede l’inserimento al loro interno di istruzioni, linee guida generali che evitano che la macchina produca contenuti inappropriati, illegali o contenuti che possano essere ritenuti sensibili o offensivi a seconda del contesto. Poi gli strumenti ricevono anche un controllo a valle degli output, prima che vengano proposti a chi li sta usando. Queste regole si chiamano, in gergo divulgativo, guardrail. E il processo di inserimento dei guardrail è continuo e reiterato. Leggi tutto: https://www.internazionale.it/notizie/alberto-puliafito/2024/10/02/limiti-intelligenza-artificiale Come si danno i comandi alle intelligenze artificiali La settimana scorsa abbiamo parlato di intelligenze artificiali che dicono parolacce e del motivo