- Conheça os diferentes tipos de conjuntos de dados
- Comece a planejar o conjunto de dados para o modelo de IA do seu projeto que irá prever algo
Estas são as atividades para esta lição:
CONJUNTOS DE DADOS SAUDÁVEIS
A primeira etapa para criar um modelo de IA que possa classificar algo é planejar o conjunto de dados.
Conjuntos de Dados Saudáveis
Muitos dados
Diferentes exemplos de dados
O tipo certo de dados
Ações ou decisões corretas
A IA PRECISA DE DADOS
Tenha em mente as seguintes qualidades ao reunir exemplos para seu conjunto de dados.
QUANTIDADE
Quanto mais exemplos você puder dar ao modelo, melhor será o desempenho dele. Forneça pelo menos 50 exemplos para cada classe.
BALANÇO
Você deve ter mais ou menos o mesmo número de exemplos para cada classe, a fim de evitar a preferência por uma em detrimento da outra.
DADOS DE TESTE
Mantenha uma parte de seus exemplos separada para testar o modelo treinado. Você precisará de alguns exemplos que não foram usados para treinar o modelo para testar se o modelo é preciso.
De 10 a 20% dos dados devem ser dados de teste.
DIVERSIDADE
Você também deve incluir exemplos variados.
Por exemplo, digamos que você esteja criando um modelo de IA para detectar se alguém está usando uma máscara facial ou não. Você deve reunir imagens que reflitam exemplos variados:
- Diferentes tipos e cores de máscaras
- Pessoas diferentes - gêneros, etnias, idades
- Diferentes planos de fundo - interno, externo, claro, escuro
- Diferentes ângulos de cabeça
- Diferentes posicionamentos da cabeça no quadro - perto, longe, lado esquerdo, lado direito
E se você treinasse seu modelo usando apenas imagens de homens brancos com máscaras cirúrgicas azuis para sua classe de máscaras? O que acontece quando uma mulher negra usando uma máscara roxa usa seu modelo? Como você acha que ela será classificada? Seu modelo terá um bom desempenho ou não?
TIPOS DE DADOS
Um conjunto de dados também deve ser o tipo certo de dados. Certifique-se de escolher o tipo de dados adequado para seu projeto! As opções são:
Números
dados estatísticos, informações demográficas, dados de sensores
Texto
mensagens, postagens no site redes sociais, livros, artigos, sites
Som
música, gravações, vozes
Imagens
rostos, lugares... qualquer coisa!
A IA TE DÁ PODER
Determinar o que entra em seu conjunto de dados te dá imenso poder!
Tenha cuidado ao determinar o que entra em seu conjunto de dados pois isso te dá um poder imenso!
Tenha o cuidado de usar muitos de dados, diferentes dados diferentes e o tipo certo de dados.
Caso contrário, seu modelo de IA
- não ser muito preciso
- poderia fazer previsões ruins
- tomar a atitude errada.
Dedicar tempo para coletar dados que formarão um conjunto de dados saudável é fundamental para um modelo bem-sucedido.
COLETA DE DADOS
Há três maneiras de coletar dados para treinar seu modelo.
Se o seu projeto se concentrar diretamente na sua comunidade, ela pode ser o local lógico para fornecer os dados de que você precisa. Certifique-se de que você tenha permissão para usar os dados!
Como os dados serão coletados em sua comunidade?
- tirar fotos?
- pedir aos membros da comunidade que lhe forneçam fotos?
- gravar sons?
- fazer uma pesquisa?
- entrevistar membros da comunidade?
Se você precisar de muitos e muitos dados para o seu modelo, pode procurar conjuntos de dados públicos. Há muitos conjuntos de dados disponíveis on-line que podem lhe fornecer grandes quantidades de dados rapidamente.
Aqui estão alguns bons sites de conjuntos de dados:
Certifique-se de revisar os dados para garantir que eles atendam aos critérios acima para um conjunto de dados saudável.
Provavelmente, você também terá que fazer algumas alterações nos dados para atender às suas necessidades. Por exemplo, ferramentas como o Teachable Machine exigem imagens quadradas, portanto, talvez seja necessário editar as imagens do conjunto de dados para que tenham as dimensões corretas para a ferramenta que você está usando.
Microcontroladores são pequenos computadores em um único circuito integrado que são usados para controlar dispositivos como motores de automóveis e eletrodomésticos. Alguns microcontroladores têm sensores incorporados. Muitos têm opções para conectar sensores a eles.
Cada um dos três microcontroladores recomendados abaixo tem seus próprios recursos específicos e pode exigir o uso de diferentes linguagens de programação para que funcionem em seu projeto. Algumas das ferramentas, como App Inventor, têm extensões que você pode adicionar para poder usar esses dispositivos com essas ferramentas. Todos os três dispositivos adicionaram recentemente o recurso de IA, portanto, você deve verificar o que é possível!
MAIS SOBRE SENSORES
Há muitos sensores de baixo custo que podem se conectar a pequenos microcontroladores e fornecer dados ao seu projeto. Aqui estão alguns sensores que podem ser usados.
Câmera
Velocímetro
Microfone
Sensor de luz
Sensor de pressão
Sensor de qualidade do ar
Termômetro infravermelho
Sensor de proximidade
ATIVIDADE: PLANEJE SEU CONJUNTO DE DADOS
Siga as instruções da planilha para fazer o outline/esboço:
- Quais dados você deseja coletar.
- Onde você coletará os dados para o seu conjunto de dados. Serão conjuntos de dados da comunidade, de sensores ou públicos?
- Como você coletará os dados? Quais serão as classes ou rótulos de seu modelo?
- Quantos exemplos para cada classe? 50 por classe deve ser o mínimo.
Dica de mentores(as)
Melhores Práticas recomendadas: Incentive os estudantes a pensar sobre os problemas que eles têm no dia a dia. Existe um conjunto de dados relacionado a isso? Há algum sensor nos itens ao seu redor? Que tipo de informação esses sensores estão coletando? Como você poderia usá-los (o novo celular do Google tem um sensor de temperatura)?
Perguntas orientadoras para fazer em estudantes: Sua cidade tem um portal de "Dados Abertos"? Exemplo: NOVA YORK e Edmonton, Canadá.
As dicas são fornecidas com o apoio do AmeriCorps.
REFLEXÃO
Agora o time tem um plano para o seu conjunto de dados! Ao começar a reunir os exemplos para seu conjunto de dados, mantenha-os seguros e bem organizados.
Não se esqueça de manter uma parte do conjunto de dados para teste! Cerca de 10 a 20% devem ser mantidos separados para teste.
REVISÃO DOS PRINCIPAIS TERMOS
Conjuntos de dados - grandes conjuntos de dados que são usados para ensinar a IA a reconhecer padrões e prever algo
Sensor - um dispositivo que detecta mudanças no ambiente e é usado para monitorar essas informações em um sistema eletrônico
Microcontrolador - pequeno computador em um único chip integrado, usado em computadores maiores e outros sistemas, como eletrodomésticos, veículos e robôs
RECURSOS ADICIONAIS
Hardware e sensores
Para obter uma lista abrangente de sensores, consulte este artigo da Wikipedia.
Este vídeo fornece boas informações sobre o hardware do microcontrolador que recomendamos para projetos que usam sensores.
Este tutorial em vídeo mostra como acessar um conjunto de dados públicos no Kaggle.