AI: insiemi di dati

  • Impara a conoscere i diversi tipi di set di dati
  • Inizia a pianificare il set di dati per il tuo progetto Modello di intelligenza artificiale che predice qualcosa

Queste sono le attività di questa lezione:

SET DI DATI SANI

Il primo passo per creare un modello di intelligenza artificiale in grado di classificare qualcosa è pianificare il set di dati.

Set di dati sani

freccia destra

Tanti dati

Diversi esempi di dati

Il giusto tipo di dati

freccia destra

Azioni o decisioni corrette

L'INTELLIGENZA ARTIFICIALE HA BISOGNO DI DATI

Tieni a mente le seguenti qualità quando raccogli esempi per il tuo set di dati.

QUANTITÀ

Più esempi puoi fornire al modello, migliori saranno le sue prestazioni. Fornisci almeno 50 esempi per ogni classe.

bilance bilanciate

EQUILIBRIO

Dovresti avere circa lo stesso numero di esempi per ciascuna classe, per evitare di privilegiare l'una rispetto all'altra.

cartelle

DATI DI PROVA

Tieni una parte degli esempi separati per testare il modello addestrato. Avrai bisogno di alcuni esempi che non sono stati utilizzati per addestrare il modello per verificare se il tuo modello è accurato.
Il 10-20% dei dati dovrebbe essere costituito da dati di prova.

DIVERSITÀ

Inoltre, è bene includere esempi variegati.

Ad esempio, supponiamo che tu stia creando un modello di intelligenza artificiale per rilevare se qualcuno indossa o meno una maschera facciale. Dovresti raccogliere immagini che riflettano vari esempi:

 

  • Diversi tipi e colori di maschere
  • Persone diverse - generi, etnie, età
  • Sfondi diversi: interni, esterni, chiari, scuri
  • Diverse angolazioni della testa
  • Posizionamento diverso della testa nell'inquadratura: vicino, lontano, lato sinistro, lato destro

E se il modello venisse addestrato solo con immagini di uomini bianchi con maschere chirurgiche blu per la classe di maschere? Cosa succede quando una donna di colore che indossa una maschera viola utilizza il tuo modello? Come pensi che verrà classificata? Il tuo modello funzionerà bene o no?

Donna afroamericana con maschera

TIPI DI DATI

Un set di dati deve anche essere del tipo giusto. Assicurati di scegliere il tipo di dati più adatto al tuo progetto! Le opzioni sono:

icona di excel

Numeri

dati statistici, informazioni demografiche, dati dei sensori

documento di testo

Testo

messaggi, post sui social media, libri, articoli e siti web

onda sonora

Suono

musica, registrazioni, voci

icone immagine

Immagini

volti, luoghi... qualsiasi cosa!

AI TI DÀ POTERE

Stabilire cosa va a finire nel tuo set di dati ti dà un potere immenso!

Fai attenzione ad usare Determinare cosa va a finire nel tuo set di dati ti dà un potere immenso!

Fai attenzione a utilizzare molti di dati, diversi dati e il giusto tipo di dati.

Altrimenti, il tuo modello di intelligenza artificiale

  • non è molto preciso
  • potrebbe fare previsioni sbagliate
  • intraprendere l'azione sbagliata.

Prendersi il tempo necessario per raccogliere i dati che costituiranno una serie di dati sani è fondamentale per il successo di un modello.

ragazza con il pugno in aria

RACCOLTA DATI

Ci sono tre modi per raccogliere i dati per l'addestramento del modello.

ULTERIORI INFORMAZIONI SUI SENSORI

Esistono molti sensori a basso costo che possono essere collegati a piccoli microcontrollori e fornire dati al tuo progetto. Ecco alcuni sensori che potrebbero essere utilizzati.

Macchina fotografica

Macchina fotografica

Tachimetro

Microfono

Sensore di luce

Sensore di pressione

Sensore di qualità dell'aria

Termometro a infrarossi

Sensore di prossimità

ATTIVITÀ: PIANIFICA IL TUO SET DI DATI

Tempo stimato: 45 minuti

Segui le istruzioni del foglio di lavoro per delineare il profilo:

  • Quali dati vuoi raccogliere.
  • Dove raccoglierai i dati per il tuo set di dati. Si tratterà di dati della comunità, di sensori o di dati pubblici?
  • Come raccoglierai i dati? Quali saranno le classi o le etichette del tuo modello?
  • Quanti esempi per ogni classe? Un minimo di 50 per classe.
Aprire il foglio di lavoro

Le migliori pratiche: Incoraggia gli studenti a pensare ai problemi che hanno nella loro vita quotidiana: c'è un set di dati che li riguarda? Ci sono dei sensori negli oggetti che ti circondano? Che tipo di informazioni raccolgono questi sensori? Come potresti utilizzarli (il nuovo google phone ha un sensore di temperatura)?

Domande guida da porre agli studenti: La tua città ha un portale "Open Data"? Esempio: NYC e Edmonton, Canada.

I consigli dei mentori sono forniti dal supporto di AmeriCorps.

A stilizzata, logo AmeriCorps in blu

RIFLESSIONE

Ora hai un piano per il tuo set di dati! Quando inizi a raccogliere gli esempi per il tuo set di dati, tienili al sicuro e ben organizzati.

Non dimenticare di conservare una parte del set di dati per i test! Circa il 10-20% dovrebbe essere tenuto separato per i test.

riflesso nel lago

REVISIONE DEI TERMINI CHIAVE

  • Insiemi di dati - grandi insiemi di dati che vengono utilizzati per insegnare all'intelligenza artificiale a riconoscere modelli e a prevedere qualcosa.

  • Sensore - un dispositivo che rileva i cambiamenti nell'ambiente e viene utilizzato per monitorare tali informazioni all'interno di un sistema elettronico.

  • Microcontrollore - piccolo computer su un singolo chip integrato, utilizzato in computer più grandi e in altri sistemi come elettrodomestici, veicoli e robot.

RISORSE AGGIUNTIVE

Hardware e sensori


Per un elenco completo dei sensori, consulta questo articolo di Wikipedia articolo di Wikipedia.

Questo video fornisce buone informazioni sull'hardware del microcontrollore che consigliamo per i progetti che utilizzano i sensori.

Questo video tutorial ti mostra come accedere a un set di dati pubblici su Kaggle.