AI: Conjuntos de datos

  • Conozca los distintos tipos de conjuntos de datos
  • Empieza a planificar el conjunto de datos para tu proyecto Modelo de IA que predecirá algo

Éstas son las actividades para esta lección:

CONJUNTOS DE DATOS SANOS

El primer paso para crear un modelo de IA que pueda clasificar algo es planificar el conjunto de datos.

Conjuntos de datos sanos

flecha derecha

Muchos datos

Diferentes ejemplos de datos

El tipo adecuado de datos

flecha derecha

Acciones o decisiones correctas

LA INTELIGENCIA ARTIFICIAL NECESITA DATOS

Ten en cuenta las siguientes cualidades a la hora de recopilar ejemplos para su conjunto de datos.

CANTIDAD

Cuantos más ejemplos proporciones al modelo, mejor funcionará. Proporciona al menos 50 ejemplos para cada clase.

balanzas equilibradas

BALANCE

Debe tener más o menos el mismo número de ejemplos para cada clase, con el fin de evitar el sesgo de una sobre la otra.

carpetas

DATOS DE PRUEBA

Guarda una parte de los ejemplos para probar el modelo entrenado. Necesitarás algunos ejemplos que no se utilizaron para entrenar el modelo para probar si el modelo es preciso.
El 10-20% de los datos deberían ser datos de prueba.

DIVERSIDAD

También debe incluir ejemplos variados.

Por ejemplo, supongamos que estás creando un modelo de IA para detectar si alguien lleva una mascarilla o no. Deberías reunir imágenes que reflejen ejemplos variados:

 

  • Diferentes tipos y colores de máscaras
  • Diferentes personas: géneros, etnias, edades
  • Diferentes fondos: interior, exterior, claro, oscuro
  • Diferentes ángulos de la cabeza
  • Diferente colocación de la cabeza en el encuadre: cerca, lejos, a la izquierda, a la derecha

¿Qué pasaría si sólo entrenaras tu modelo utilizando imágenes de hombres blancos con mascarillas quirúrgicas azules para tu clase de mascarillas? ¿Qué ocurre cuando una mujer de color con una mascarilla morada utiliza tu modelo? ¿Cómo crees que se clasificará? ¿Tu modelo funcionará bien o no?

Mujer afroamericana con máscara

TIPOS DE DATOS

Un conjunto de datos también debe ser el tipo de datos adecuado. Asegúrese de elegir el tipo de datos adecuado para su proyecto. Las opciones son:

icono excel

Números

datos estadísticos, información demográfica, datos de sensores

documento de texto

Texto

mensajes, publicaciones en redes sociales, libros, artículos, sitios web

onda sonora

Sonido

música, grabaciones, voces

iconos de imagen

Imágenes

caras, lugares... ¡lo que sea!

LA AI TE DA PODER

¡Determinar lo que entra en su conjunto de datos te da un poder inmenso!

Ten cuidado al utilizar Determinar, puesto que lo que entra en tu conjunto de datos te da un poder inmenso.

Ten cuidado de utilizar muchos de datos, diferentes datos, y el tipo adecuado de datos.

De lo contrario, su modelo de IA

  • no ser muy preciso
  • podría hacer malas predicciones
  • tomar las medidas equivocadas.

Tomarse el tiempo necesario para recopilar los datos que conformarán un conjunto de datos saludable es fundamental para el éxito de un modelo.

chica con el puño en alto

RECOPILACIÓN DE DATOS

Hay tres formas de recopilar datos para entrenar el modelo.

MÁS SOBRE SENSORES

Hay muchos sensores de bajo costo que pueden conectarse a pequeños microcontroladores y proporcionar datos a tu proyecto. He aquí algunos sensores que podrían utilizarse.

cámara

Cámara

Velocímetro

Micrófono

Sensor de luz

Sensor de presión

Sensor de calidad del aire

Termómetro infrarrojo

Sensor de proximidad

ACTIVIDAD: PLANIFIQUE SU CONJUNTO DE DATOS

Tiempo estimado: 45 minutos

Sigue las instrucciones de la hoja de ejercicios para hacer el esquema:

  • Qué datos deseas recopilar.
  • Dónde recopilará los datos para su conjunto de datos. Serán conjuntos de datos comunitarios, de sensores o públicos?
  • ¿Cómo recopilará los datos? ¿Cuáles serán las clases o etiquetas de tu modelo?
  • ¿Cuántos ejemplos por clase? 50 por clase debería ser el mínimo.
Abrir hoja de cálculo

Mejores prácticas: Anima a las alumnas a pensar en los problemas que tienen en su día a día, ¿hay algún conjunto de datos relacionado con eso? ¿Hay sensores en los objetos que les rodean? ¿Qué tipo de información recogen estos sensores? ¿Cómo podrías utilizarlos (el nuevo teléfono de google tiene un sensor de temperatura)?

Preguntas orientativas para las alumnas:¿Dispone su ciudad de un portal de "Datos abiertos"? Ejemplo: NYC y Edmonton, Canadá.

Los consejos de los mentores se proporcionan gracias al apoyo de AmeriCorps.

A estilizada, logotipo de AmeriCorps en azul marino

REFLEXIÓN

Ya tienes un plan para tu conjunto de datos. Cuando empieces a reunir los ejemplos para tu conjunto de datos, manténlos seguros y bien organizados.

No olvides conservar una parte del conjunto de datos para las pruebas. Alrededor de un 10-20% debe mantenerse separado para las pruebas.

reflejo en el lago

REVISIÓN DE TÉRMINOS CLAVE

  • Conjuntos de datos - grandes conjuntos de datos que se utilizan para enseñar a la IA a reconocer patrones y predecir algo

  • Sensor - dispositivo que detecta cambios en el entorno y se utiliza para controlar esa información dentro de un sistema electrónico.

  • Microcontrolador - pequeño ordenador en un único chip integrado, utilizado en ordenadores más grandes y otros sistemas como electrodomésticos, vehículos y robots.

RECURSOS ADICIONALES

Hardware y sensores


Para obtener una lista completa de sensores, consulta este artículo de Wikipedia.

Este video ofrece buena información sobre el hardware de microcontroladores que recomendamos para los proyectos que utilizan sensores.

Este tutorial de video te muestra cómo acceder a un conjunto de datos público en Kaggle.