- Impara a conoscere i diversi tipi di set di dati
- Inizia a pianificare il set di dati per il tuo progetto Modello di intelligenza artificiale che predice qualcosa
Queste sono le attività di questa lezione:
SET DI DATI SANI
Il primo passo per creare un modello di intelligenza artificiale in grado di classificare qualcosa è pianificare il set di dati.
Set di dati sani

Tanti dati
Diversi esempi di dati
Il giusto tipo di dati

Azioni o decisioni corrette
L'INTELLIGENZA ARTIFICIALE HA BISOGNO DI DATI
Tieni a mente le seguenti qualità quando raccogli esempi per il tuo set di dati.

QUANTITÀ
Più esempi puoi fornire al modello, migliori saranno le sue prestazioni. Fornisci almeno 50 esempi per ogni classe.

EQUILIBRIO
Dovresti avere circa lo stesso numero di esempi per ciascuna classe, per evitare di privilegiare l'una rispetto all'altra.

DATI DI PROVA
Tieni una parte degli esempi separati per testare il modello addestrato. Avrai bisogno di alcuni esempi che non sono stati utilizzati per addestrare il modello per verificare se il tuo modello è accurato.
Il 10-20% dei dati dovrebbe essere costituito da dati di prova.
DIVERSITÀ
Inoltre, è bene includere esempi variegati.
Ad esempio, supponiamo che tu stia creando un modello di intelligenza artificiale per rilevare se qualcuno indossa o meno una maschera facciale. Dovresti raccogliere immagini che riflettano vari esempi:
- Diversi tipi e colori di maschere
- Persone diverse - generi, etnie, età
- Sfondi diversi: interni, esterni, chiari, scuri
- Diverse angolazioni della testa
- Posizionamento diverso della testa nell'inquadratura: vicino, lontano, lato sinistro, lato destro

E se il modello venisse addestrato solo con immagini di uomini bianchi con maschere chirurgiche blu per la classe di maschere? Cosa succede quando una donna di colore che indossa una maschera viola utilizza il tuo modello? Come pensi che verrà classificata? Il tuo modello funzionerà bene o no?


TIPI DI DATI
Un set di dati deve anche essere del tipo giusto. Assicurati di scegliere il tipo di dati più adatto al tuo progetto! Le opzioni sono:

Numeri
dati statistici, informazioni demografiche, dati dei sensori

Testo
messaggi, post sui social media, libri, articoli e siti web

Suono
musica, registrazioni, voci

Immagini
volti, luoghi... qualsiasi cosa!
AI TI DÀ POTERE
Stabilire cosa va a finire nel tuo set di dati ti dà un potere immenso!
Fai attenzione ad usare Determinare cosa va a finire nel tuo set di dati ti dà un potere immenso!
Fai attenzione a utilizzare molti di dati, diversi dati e il giusto tipo di dati.
Altrimenti, il tuo modello di intelligenza artificiale
- non è molto preciso
- potrebbe fare previsioni sbagliate
- intraprendere l'azione sbagliata.
Prendersi il tempo necessario per raccogliere i dati che costituiranno una serie di dati sani è fondamentale per il successo di un modello.

RACCOLTA DATI
Ci sono tre modi per raccogliere i dati per l'addestramento del modello.
Se il tuo progetto si concentra direttamente sulla tua comunità, quest'ultima potrebbe essere il luogo più logico per fornire i dati di cui hai bisogno. Assicurati di avere il permesso di utilizzare i dati!
Come si raccolgono i dati nella tua comunità?
- fare foto?
- chiedere ai membri della comunità di fornirti delle foto?
- registrare i suoni?
- utilizzare un sondaggio?
- intervistare i membri della comunità?
Se hai bisogno di moltissimi dati per il tuo modello, potresti cercare dei dataset pubblici. Ci sono molti set di dati disponibili online che possono fornirti rapidamente grandi quantità di dati.
Ecco alcuni buoni siti di dati:
Assicurati di rivedere i dati per verificare che corrispondano ai criteri di cui sopra per un set di dati sano.
Molto probabilmente dovrai anche apportare alcune modifiche ai dati per adattarli alle tue esigenze. Ad esempio, strumenti come Teachable Machine richiedono immagini quadrate, quindi potresti dover modificare le immagini del set di dati per adattarle alle dimensioni corrette dello strumento che stai utilizzando.
Microcontrollori sono piccoli computer su un singolo circuito integrato che vengono utilizzati per controllare dispositivi come i motori delle automobili e gli elettrodomestici. Alcuni microcontrollori hanno sensori integrati. Molti hanno la possibilità di collegare dei sensori.
Ognuno di i tre microcontrollori consigliati di seguito ha delle caratteristiche particolari e potrebbe richiedere l'uso di linguaggi di programmazione diversi per farle funzionare per il tuo progetto. Alcuni strumenti, come App Inventor, hanno delle estensioni che puoi aggiungere per poter utilizzare questi dispositivi con questi strumenti. Tutti e tre i dispositivi hanno recentemente aggiunto la funzionalità AI, quindi ti consigliamo di verificare cosa è possibile fare!
ULTERIORI INFORMAZIONI SUI SENSORI
Esistono molti sensori a basso costo che possono essere collegati a piccoli microcontrollori e fornire dati al tuo progetto. Ecco alcuni sensori che potrebbero essere utilizzati.

Macchina fotografica

Tachimetro

Microfono

Sensore di luce

Sensore di pressione

Sensore di qualità dell'aria

Termometro a infrarossi

Sensore di prossimità
ATTIVITÀ: PIANIFICA IL TUO SET DI DATI
Segui le istruzioni del foglio di lavoro per delineare il profilo:
- Quali dati vuoi raccogliere.
- Dove raccoglierai i dati per il tuo set di dati. Si tratterà di dati della comunità, di sensori o di dati pubblici?
- Come raccoglierai i dati? Quali saranno le classi o le etichette del tuo modello?
- Quanti esempi per ogni classe? Un minimo di 50 per classe.
Suggerimento del mentore
Le migliori pratiche: Incoraggia gli studenti a pensare ai problemi che hanno nella loro vita quotidiana: c'è un set di dati che li riguarda? Ci sono dei sensori negli oggetti che ti circondano? Che tipo di informazioni raccolgono questi sensori? Come potresti utilizzarli (il nuovo google phone ha un sensore di temperatura)?
Domande guida da porre agli studenti: La tua città ha un portale "Open Data"? Esempio: NYC e Edmonton, Canada.
I consigli dei mentori sono forniti dal supporto di AmeriCorps.

RIFLESSIONE
Ora hai un piano per il tuo set di dati! Quando inizi a raccogliere gli esempi per il tuo set di dati, tienili al sicuro e ben organizzati.
Non dimenticare di conservare una parte del set di dati per i test! Circa il 10-20% dovrebbe essere tenuto separato per i test.

REVISIONE DEI TERMINI CHIAVE
Insiemi di dati - grandi insiemi di dati che vengono utilizzati per insegnare all'intelligenza artificiale a riconoscere modelli e a prevedere qualcosa.
Sensore - un dispositivo che rileva i cambiamenti nell'ambiente e viene utilizzato per monitorare tali informazioni all'interno di un sistema elettronico.
Microcontrollore - piccolo computer su un singolo chip integrato, utilizzato in computer più grandi e in altri sistemi come elettrodomestici, veicoli e robot.
RISORSE AGGIUNTIVE
Hardware e sensori
Per un elenco completo dei sensori, consulta questo articolo di Wikipedia articolo di Wikipedia.
Questo video fornisce buone informazioni sull'hardware del microcontrollore che consigliamo per i progetti che utilizzano i sensori.
Questo video tutorial ti mostra come accedere a un set di dati pubblici su Kaggle.