Post

Dove trovare raccolte di dati (dataset) utilizzabili gratuitamente

Quando si entra nel fantastico mondo dell'analisi dei dati il primo ingrediente che serve sono... i dati. E le raccolte di dati diventano fondamentali anche in seguito quando, ad esempio, si vuole addestrare un modello di machine learning. In questa pagina annoto i siti dai quali è possibile scaricare gratuitamente e legalmente dataset curati di dati. Chiunque può contribuire segnalandone di nuovi nei commenti Meta Datasets . La pagina dei Datasets di Meta AI offre un'incredibile raccolta di dataset su larga scala e benchmark per l'addestramento, il test e la valutazione dei modelli di intelligenza artificiale. I dataset coprono vari ambiti come la segmentazione degli oggetti, modelli visione-linguaggio, ricostruzione 3D, equità algoritmica e traduzione automatica. Esempi includono il dataset SA-V per la segmentazione, FACET per valutare l'equità nei modelli visivi e Ego4D per la comprensione di video in prima persona. Tutti i dataset possono essere scaricati gratuita

Alternative a Yahoo Finance per scaricare i dati di borsa

Da qualche mese non è più possibile scaricare gratuitamente lo storico dei dati di borsa da Yahoo Finance. Una scelta comprensibile, dettata probabilmente dalla volontà di monetizzare i dati in loro possesso, ma che rappresenta una perdita per chi utilizza queste informazioni come campo di allenamento per attività di analisi dei dati. I dati di borsa sono, infatti, una delle risorse più versatili per esercitarsi in tutte le fasi del processo di analisi: dall’estrazione e pulizia dei dati, alla loro trasformazione, fino all’analisi di serie storiche e all’applicazione di tecniche previsionali, incluse quelle basate su machine learning. Yahoo Finance: un’opportunità perduta Fino a poco tempo fa, Yahoo Finance consentiva di accedere a dati storici su prezzi, dividendi e frazionamenti per una vasta gamma di titoli, con una profondità temporale che, in alcuni casi, arrivava agli

Qwen 2.5 Coder 32B è pronto a cambiare la vita (gratuitamente) a migliaia di sviluppatori - DDay

Qwen è il nome di una serie di modelli linguistici avanzati sviluppati da Alibaba Cloud, uno dei principali provider di cloud computing e intelligenza artificiale al mondo, e rilasciati in modalità opensource. Sono in poche parole la versione sviluppata da Alibaba di LLama, sviluppato da Facebook. Nel pacchetto di modelli Qwen è stato annunciato negli scorsi mesi Qwen2.5 Coder, un modello che come dice il nome stesso nasce con l’obiettivo di scrivere codice, completare codice e gestire eventuali errori con supporto a decine di diversi linguaggi di programmazione . Leggi tutto:  https://www.dday.it/redazione/51078/qwen-25-coder-32b-e-pronto-a-cambiare-la-vita-gratuitamente-a-migliaia-di-sviluppatori

E se l'intelligenza artificiale leggesse al nostro posto? - Wired

Negli ultimi anni abbiamo imparato a conoscere (e persino a giocare con) l’ intelligenza artificiale che scrive testi, crea immagini e anche canzoni basandosi sulle nostre più o meno accurate indicazioni. Ma cosa succederebbe - e che impatto avrebbe nelle nostre vite - se l’IA iniziasse a leggere e interpretare testi complessi in nostra vece? Dovremmo confrontarci con tematiche riguardanti la comprensione del testo , il deskilling umano, il riconoscimento o la perdita della voce autoriale e persino rivedere il processo di formazione delle idee . Leggi tutto:  https://www.wired.it/article/intelligenza-artificiale-legge-umani-intervista-naomi-susan-baron/

Translated presenta Lara, l'intelligenza artificiale che traduce meglio delle altre perché capisce il contesto - Wired

“La terra è rossa” . “The earth is red” . È la prima frase tradotta pubblicamente da Lara, il traduttore automatico più potente al mondo. Realizzato da Translated e alimentato dall'intelligenza artificiale, è disponibile online da lunedì 4 novembre. Il programma è stato realizzato da Translated , società fondata nel 1999 che unisce creatività umana e nuove tecnologie per realizzare rapidamente traduzioni attendibili. Il modello di intelligenza artificiale utilizzato è stato allenato in partnership con Nvidia e funziona grazie a una grande mole di dati (circa dieci miliardi di parole ) raccolti negli ultimi venticinque anni. Lara non solo trasferisce frasi ed espressioni da un idioma all’altro, ma spiega e comprende anche il contesto in cui una frase viene pronunciata e deve essere tradotta. Se non capisce immediatamente, si aggiunge una nota, come: "La terra è rossa perché siamo in un campo da tennis" . Ed ecco che “the earth” diventa "the court" . Leggi t

Il lavoro impossibile dei sondaggisti statunitensi - Internazionale

All’inizio del novecento, prima delle elezioni presidenziali la rivista Literary Digest inviava ai lettori schede elettorali campione, chiedendogli di mandarle indietro compilate. Era uno dei primi sondaggi condotti su scala nazionale, rudimentale ma apparentemente efficace. Con questo metodo la rivista riuscì a prevedere il vincitore di cinque elezioni presidenziali, dal 1916 al 1932. Ma nel 1936, quando si sfidavano il presidente Franklin D. Roosevelt e il repubblicano Alf Landon, qualcosa andò storto. Il Digest inviò dieci milioni di schede elettorali ricevendone indietro 2,4 milioni, un tasso di risposta molto alto. Sulla base di quelle schede, il giornale predisse che Roosevelt avrebbe preso solo il 41 per cento dei voti, una batosta epocale. Il presidente vinse invece con il 61 per cento dei consensi, conquistando tutti gli stati tranne due, in una delle elezioni meno incerte della storia statunitense. Leggi tutto:  https://www.internazionale.it/notizie/alessio-marchionna/2024/1

L’intelligenza artificiale generale ha rotto - Wired

Ogni giorno esce almeno un articolo in cui si parla dell’ intelligenza artificiale generale come di una prospettiva realistica. Potrebbe sembrare un modo per aiutare il pubblico a chiarirsi le idee sull’evoluzione della più affascinante tra le nuove tecnologie. In realtà, si sta facendo un lavoro completamente diverso: quello di megafono dei colossi della Silicon Valley e dei loro interessi economici e politici. L’intelligenza artificiale generale non esiste , è molto improbabile che venga conquistata in un prossimo futuro e non è nemmeno chiaro se mai si riuscirà in questa impresa. E allora perché se ne parla così tanto? Perché sembra una prospettiva non solo inevitabile, ma addirittura destinata a concretizzarsi nel giro di qualche anno? Leggi tutto: https://www.wired.it/article/intelligenza-artificiale-generale-ricerca-miti/

Cos'è jupiter e quali sono le somiglianze e le differenze con kaggle?

Jupyter e Kaggle sono due strumenti importanti per chi lavora con la programmazione, l'analisi dei dati e il machine learning, ma hanno scopi e caratteristiche differenti: Jupyter Notebook Jupyter è un ambiente open-source che permette di creare e condividere documenti interattivi chiamati notebook , usati per scrivere e eseguire codice, documentare progetti e visualizzare i risultati (grafici, tabelle, ecc.). È molto flessibile, supporta diversi linguaggi (Python, R, Julia) e viene installato in locale o su server (usando JupyterLab per progetti più complessi). Sito:  https://jupyter.org/ Kaggle Kaggle è una piattaforma online per competizioni di data science, con un ambiente integrato di notebook e dataset. Permette agli utenti di scrivere codice, partecipare a competizioni di machine learning, accedere a dataset pubblici e collaborare con altri data scientist. A differenza di Jupyter, Kaggle fornisce accesso diretto a risorse di calcolo, come GPU e TPU, senza configura