KI: Datensätze

  • Lerne die verschiedenen Arten von Datensätzen kennen
  • Beginne, den Datensatz für dein Projekt-AI-Modell zu planen, das etwas vorhersagen soll.

Das sind die Aktivitäten für diese Lektion:

GESUNDE DATENSÄTZE

Der erste Schritt bei der Erstellung eines KI-Modells, das etwas klassifizieren kann, ist die Planung des Datensatzes.

Gesunde Datensätze

Rechter Pfeil

Viele Daten

Verschiedene Beispiele für Daten

Die richtige Art von Daten

Rechter Pfeil

Korrekte Handlungen oder Entscheidungen

KI BRAUCHT DATEN

Behalte die folgenden Eigenschaften im Hinterkopf, wenn du Beispiele für deinen Datensatz sammelst.

MENGE

Je mehr Beispiele du dem Modell geben kannst, desto besser wird es abschneiden. Gib mindestens 50 Beispiele für jede Klasse an.

ausgewogene Waage

BALANCE

Du solltest für jede Klasse ungefähr die gleiche Anzahl von Beispielen haben, um zu verhindern, dass eine Klasse gegenüber der anderen bevorzugt wird.

Mappen

TESTDATEN

Halte einen Teil deiner Beispiele separat, um das trainierte Modell zu testen. Du brauchst einige Beispiele, die nicht zum Trainieren des Modells verwendet wurden, um zu testen, ob dein Modell genau ist.
10-20% der Daten sollten Testdaten sein.

VIELFALT

Du möchtest auch verschiedene Beispiele einbeziehen.

Angenommen, du erstellst ein KI-Modell, um zu erkennen, ob jemand eine Gesichtsmaske trägt. Du solltest Bilder sammeln, die verschiedene Beispiele widerspiegeln:

 

  • Verschiedene Arten und Farben von Masken
  • Unterschiedliche Menschen - Geschlechter, Ethnien, Alter
  • Verschiedene Hintergründe - drinnen, draußen, hell, dunkel
  • Verschiedene Kopfneigungen
  • Unterschiedliche Platzierung des Kopfes im Rahmen - nah, fern, links, rechts

Was wäre, wenn du dein Modell nur mit Bildern von weißen Männern mit blauen OP-Masken für deine Maskenklasse trainierst? Was passiert, wenn eine farbige Frau mit einer lila Maske dein Modell verwendet? Was glaubst du, wie sie klassifiziert werden wird? Wird dein Modell gut abschneiden oder nicht?

Afroamerikanische Frau mit Maske

TYPEN VON DATEN

Ein Datensatz muss auch die richtige Art von Daten sein. Achte darauf, dass du den richtigen Datentyp für dein Projekt auswählst! Die Optionen sind:

Excel-Symbol

Zahlen

statistische Daten, demografische Informationen, Sensordaten

Textdokument

Text

Nachrichten, Beiträge in sozialen Medien, Bücher, Artikel, Websites

Schallwelle

Ton

Musik, Aufnahmen, Stimmen

Bildsymbole

Bilder

Gesichter, Orte ... alles!

KI GIBT DIR MACHT

Die Entscheidung, was in deinen Datensatz kommt, gibt dir immense Macht!

Achte darauf, was du verwendest, Die Entscheidung, was in deinen Datensatz kommt, gibt dir immense Macht!

Achte darauf, dass du viele Daten, verschiedene Daten und die richtige Art von Daten benutzt.

Andernfalls wird dein KI-Modell

  • nicht sehr genau sein
  • könnte schlechte Vorhersagen machen
  • die falschen Maßnahmen ergreifen.

Für ein erfolgreiches Modell ist es wichtig, dass du dir die Zeit nimmst, Daten zu sammeln, die einen gesunden Datensatz ergeben.

Mädchen mit Faust in der Luft

DATENSAMMLUNG

Es gibt 3 Möglichkeiten, Daten zur Schulung deines Modells zu sammeln.

MEHR ÜBER SENSOREN

Es gibt viele kostengünstige Sensoren, die an kleine Mikrocontroller angeschlossen werden können und dein Projekt mit Daten versorgen. Hier sind einige Sensoren, die du verwenden kannst.

Kamera

Kamera

Geschwindigkeitsmesser

Mikrofon

Lichtsensor

Drucksensor

Luftqualitätssensor

Infrarot-Thermometer

Näherungssensor

AKTIVITÄT: PLANE DEINEN DATENSATZ

Geschätzte Zeit: 45 Minuten

Befolge die Anweisungen auf dem Arbeitsblatt, um eine Gliederung zu erstellen:

  • Welche Daten du sammeln willst.
  • Wo wirst du die Daten für deinen Datensatz sammeln? Werden es kommunale, sensorische oder öffentliche Datensätze sein?
  • Wie wirst du die Daten sammeln? Wie werden die Klassen oder Labels für dein Modell aussehen?
  • Wie viele Beispiele für jede Klasse? 50 pro Klasse sollten das Minimum sein.
Öffne das Arbeitsblatt

Beste Praktiken: Ermutige die Schüler/innen, über die Probleme nachzudenken, die sie in ihrem täglichen Leben haben. Gibt es Sensoren in den Gegenständen um dich herum? Welche Art von Informationen sammeln diese Sensoren? Wie könntest du sie nutzen (das neue Google-Handy hat einen Temperatursensor)?

Leitfragen, die du den Schülern stellen kannst: Gibt es in deiner Stadt ein "Open Data"-Portal? Beispiel: NYC und Edmonton, Kanada.

Mentorentipps werden durch die Unterstützung von AmeriCorps bereitgestellt.

stilisiertes A, AmeriCorps-Logo in Marineblau

REFLEXION

Du hast jetzt einen Plan für deinen Datensatz! Wenn du anfängst, die Beispiele für deinen Datensatz zu sammeln, bewahre sie sicher und gut organisiert auf.

Vergiss nicht, einen Teil des Datensatzes zum Testen aufzubewahren! Etwa 10-20% sollten für Tests aufbewahrt werden.

Spiegelung im See

ÜBERPRÜFUNG DER SCHLÜSSELBEGRIFFE

  • Datensätze - große Datensätze, die verwendet werden, um KI zu lehren, Muster zu erkennen und etwas vorherzusagen

  • Sensor - ein Gerät, das Veränderungen in der Umgebung feststellt und zur Überwachung dieser Informationen in einem elektronischen System verwendet wird

  • Mikrocontroller - kleiner Computer auf einem einzigen integrierten Chip, der in größeren Computern und anderen Systemen wie Geräten, Fahrzeugen und Robotern eingesetzt wird

ZUSÄTZLICHE RESSOURCEN

Hardware und Sensoren


Eine umfassende Liste von Sensoren findest du in diesem Wikipedia-Artikel.

Dieses Video gibt gute Informationen über die Mikrocontroller-Hardware, die wir für Projekte mit Sensoren empfehlen.

Dieses Video-Tutorial zeigt dir, wie du auf einen öffentlichen Datensatz bei Kaggle zugreifen kannst.