IA: Conjuntos de Dados

  • Conheça os diferentes tipos de conjuntos de dados
  • Comece a planejar o conjunto de dados para o modelo de IA do seu projeto que irá prever algo

Estas são as atividades para esta lição:

CONJUNTOS DE DADOS SAUDÁVEIS

A primeira etapa para criar um modelo de IA que possa classificar algo é planejar o conjunto de dados.

Conjuntos de Dados Saudáveis

seta para a direita

Muitos dados

Diferentes exemplos de dados

O tipo certo de dados

seta para a direita

Ações ou decisões corretas

A IA PRECISA DE DADOS

Tenha em mente as seguintes qualidades ao reunir exemplos para seu conjunto de dados.

QUANTIDADE

Quanto mais exemplos você puder dar ao modelo, melhor será o desempenho dele. Forneça pelo menos 50 exemplos para cada classe.

balanças balanceadas

BALANÇO

Você deve ter mais ou menos o mesmo número de exemplos para cada classe, a fim de evitar a preferência por uma em detrimento da outra.

pastas

DADOS DE TESTE

Mantenha uma parte de seus exemplos separada para testar o modelo treinado. Você precisará de alguns exemplos que não foram usados para treinar o modelo para testar se o modelo é preciso.
De 10 a 20% dos dados devem ser dados de teste.

DIVERSIDADE

Você também deve incluir exemplos variados.

Por exemplo, digamos que você esteja criando um modelo de IA para detectar se alguém está usando uma máscara facial ou não. Você deve reunir imagens que reflitam exemplos variados:

 

  • Diferentes tipos e cores de máscaras
  • Pessoas diferentes - gêneros, etnias, idades
  • Diferentes planos de fundo - interno, externo, claro, escuro
  • Diferentes ângulos de cabeça
  • Diferentes posicionamentos da cabeça no quadro - perto, longe, lado esquerdo, lado direito

E se você treinasse seu modelo usando apenas imagens de homens brancos com máscaras cirúrgicas azuis para sua classe de máscaras? O que acontece quando uma mulher negra usando uma máscara roxa usa seu modelo? Como você acha que ela será classificada? Seu modelo terá um bom desempenho ou não?

Mulher afro-americana com máscara

TIPOS DE DADOS

Um conjunto de dados também deve ser o tipo certo de dados. Certifique-se de escolher o tipo de dados adequado para seu projeto! As opções são:

ícone do Excel

Números

dados estatísticos, informações demográficas, dados de sensores

documento de texto

Texto

mensagens, postagens no site redes sociais, livros, artigos, sites

onda sonora

Som

música, gravações, vozes

ícones de imagem

Imagens

rostos, lugares... qualquer coisa!

A IA TE DÁ PODER

Determinar o que entra em seu conjunto de dados te dá imenso poder!

Tenha cuidado ao determinar o que entra em seu conjunto de dados pois isso te dá um poder imenso!

Tenha o cuidado de usar muitos de dados, diferentes dados diferentes e o tipo certo de dados.

Caso contrário, seu modelo de IA

  • não ser muito preciso
  • poderia fazer previsões ruins
  • tomar a atitude errada.

Dedicar tempo para coletar dados que formarão um conjunto de dados saudável é fundamental para um modelo bem-sucedido.

garota com o punho no ar

COLETA DE DADOS

Há três maneiras de coletar dados para treinar seu modelo.

MAIS SOBRE SENSORES

Há muitos sensores de baixo custo que podem se conectar a pequenos microcontroladores e fornecer dados ao seu projeto. Aqui estão alguns sensores que podem ser usados.

câmera

Câmera

Velocímetro

Microfone

Sensor de luz

Sensor de pressão

Sensor de qualidade do ar

Termômetro infravermelho

Sensor de proximidade

ATIVIDADE: PLANEJE SEU CONJUNTO DE DADOS

Tempo estimado: 45 minutos

Siga as instruções da planilha para fazer o outline/esboço:

  • Quais dados você deseja coletar.
  • Onde você coletará os dados para o seu conjunto de dados. Serão conjuntos de dados da comunidade, de sensores ou públicos?
  • Como você coletará os dados? Quais serão as classes ou rótulos de seu modelo?
  • Quantos exemplos para cada classe? 50 por classe deve ser o mínimo.
Abrir planilha

Melhores Práticas recomendadas: Incentive os estudantes a pensar sobre os problemas que eles têm no dia a dia. Existe um conjunto de dados relacionado a isso? Há algum sensor nos itens ao seu redor? Que tipo de informação esses sensores estão coletando? Como você poderia usá-los (o novo celular do Google tem um sensor de temperatura)?

Perguntas orientadoras para fazer em estudantes: Sua cidade tem um portal de "Dados Abertos"? Exemplo: NOVA YORK e Edmonton, Canadá.

As dicas são fornecidas com o apoio do AmeriCorps.

A estilizado, logotipo da AmeriCorps em azul-marinho

REFLEXÃO

Agora o time tem um plano para o seu conjunto de dados! Ao começar a reunir os exemplos para seu conjunto de dados, mantenha-os seguros e bem organizados.

Não se esqueça de manter uma parte do conjunto de dados para teste! Cerca de 10 a 20% devem ser mantidos separados para teste.

reflexo no lago

REVISÃO DOS PRINCIPAIS TERMOS

  • Conjuntos de dados - grandes conjuntos de dados que são usados para ensinar a IA a reconhecer padrões e prever algo

  • Sensor - um dispositivo que detecta mudanças no ambiente e é usado para monitorar essas informações em um sistema eletrônico

  • Microcontrolador - pequeno computador em um único chip integrado, usado em computadores maiores e outros sistemas, como eletrodomésticos, veículos e robôs

RECURSOS ADICIONAIS

Hardware e sensores


Para obter uma lista abrangente de sensores, consulte este artigo da Wikipedia.

Este vídeo fornece boas informações sobre o hardware do microcontrolador que recomendamos para projetos que usam sensores.

Este tutorial em vídeo mostra como acessar um conjunto de dados públicos no Kaggle.