AI: Veri kümeleri

  • Farklı veri kümesi türleri hakkında bilgi edinin
  • Projeniz için veri setini planlamaya başlayın Bir şeyi tahmin edecek AI modeli

Bu dersin etkinlikleri şunlardır:

SAĞLIKLI VERİ SETLERİ

Bir şeyi sınıflandırabilen bir AI modeli oluşturmanın ilk adımı, veri setini planlamaktır.

Sağlıklı Veri Kümeleri

right arrow

Çok fazla veri

Farklı veri örnekleri

Doğru türde veri

right arrow

Doğru eylemler veya kararlar

AI VERİYE İHTİYAC DUYAR

Veri setiniz için örnekler toplarken aşağıdaki özellikleri göz önünde bulundurun.

MİKTAR

Modele ne kadar çok örnek verirseniz, o kadar iyi performans gösterir. Her sınıf için en az 50 örnek verin.

balanced scales

DENGE

Bir sınıfın diğerine göre önyargılı olmaması için her sınıf için yaklaşık aynı sayıda örnek olmalıdır.

folders

TEST VERİLERİ

Eğitimli modeli test etmek için örneklerin bir kısmını ayrı tutun. Modelinizin doğru olup olmadığını test etmek için, modeli eğitmek için kullanılmayan bazı örneklere ihtiyacınız olacaktır.
Verilerin %10-20'si test verisi olmalıdır.

ÇEŞİTLİLİK

Ayrıca çeşitli örnekler eklemek isteyebilirsiniz.

Örneğin, bir kişinin yüz maskesi takıp takmadığını tespit etmek için bir AI modeli oluşturduğunuzu varsayalım. Çeşitli örnekleri yansıtan görüntüler toplamalısınız:

 

  • Farklı tür ve renklerde maskeler
  • Farklı insanlar – cinsiyetler, etnik kökenler, yaşlar
  • Farklı arka planlar – iç mekan, dış mekan, aydınlık, karanlık
  • Farklı kafa açıları
  • Çerçevede başın farklı konumları – yakın, uzak, sol taraf, sağ taraf

Maske sınıfı için sadece mavi cerrahi maske takan beyaz erkeklerin görüntülerini kullanarak modelinizi eğittiyseniz ne olur? Mor maske takan siyahi bir kadın modelinizi kullandığında ne olur? Sınıflandırma nasıl olur? Modeliniz iyi performans gösterir mi, göstermez mi?

African American woman with mask

VERİ TÜRLERİ

Veri kümesi ayrıca doğru türde veriler içermelidir. Projenize uygun veri türünü seçtiğinizden emin olun! Seçenekler şunlardır:

excel icon

Sayılar

istatistiksel veriler, demografik bilgiler, sensör verileri

text document

Metin

mesajlar, sosyal medya gönderileri, kitaplar, makaleler, web siteleri

sound wave

Ses

müzik, kayıtlar, sesler

image icons

Görseller

yüzler, yerler... her şey!

AI SİZE GÜÇ VERİR

Veri setinize nelerin gireceğini belirlemek size büyük bir güç!

Kullanırken dikkatli olun Veri kümenize neyin gireceğini belirlemek size büyük bir güç verir!

Dikkatli kullanın çok veri, farklı veri ve doğru türde tür

Aksi takdirde, AI modeliniz

  • çok doğru olmayabilir
  • kötü tahminlerde bulunabilir
  • yanlış hareket etmek.

Sağlıklı bir veri seti oluşturmak için veri toplamaya zaman ayırmak, başarılı bir model için çok önemlidir.

girl with fist in the air

VERİ TOPLAMA

Modelinizi eğitmek için veri toplamak için 3 yol vardır.

SENSÖRLER HAKKINDA DAHA FAZLA BİLGİ

Küçük mikrodenetleyicilere bağlanabilen ve projenize veri sağlayabilen birçok düşük maliyetli sensör bulunmaktadır. İşte kullanılabilecek bazı sensörler.

camera

Kamera

Hız göstergesi

Mikrofon

Işık sensörü

Basınç sensörü

Hava kalitesi sensörü

Kızılötesi Termometre

Yakınlık sensörü

AKTİVİTE: VERİ SETİNİZİ PLANLAYIN

Tahmini süre: 45 dakika

Çalışma kağıdındaki talimatları izleyerek özetleyin:

  • Hangi verileri toplamak istiyorsunuz?
  • Veri setiniz için verileri nereden toplayacaksınız? Topluluk, sensörler veya kamuya açık veri setleri mi olacak?
  • Verileri nasıl toplayacaksınız? Modeliniz için sınıflar veya etiketler ne olacak?
  • Her sınıf için kaç örnek var? Sınıf başına en az 50 örnek olmalı.
Çalışma sayfasını aç

En iyi uygulamalar: Öğrencileri günlük yaşamlarında karşılaştıkları sorunlar hakkında düşünmeye teşvik edin, bununla ilgili bir veri seti var mı? Çevrenizdeki nesnelerde herhangi bir sensör var mı? Bu sensörler ne tür bilgiler topluyor? Bunları nasıl kullanabilirsiniz (yeni google telefonunda sıcaklık sensörü var)?

Öğrencilere sorulacak yol gösterici sorular: Şehrinizde "Açık Veri" portalı var mı? Örnek: NYC ve Edmonton, Kanada

Mentor ipuçları AmeriCorps'un desteği ile sağlanmaktadır.

stylized A, AmeriCorps logo in navy

YANSIMA

Artık veri setiniz için bir planınız var! Veri setiniz için örnekleri toplamaya başladığınızda, bunları güvenli ve düzenli bir şekilde saklayın.

Test için veri setinin bir kısmını saklamayı unutmayın! Test için yaklaşık %10-20'si ayrı tutulmalıdır.

reflection in lake

ANAHTAR TERİMLERİN GÖZDEN GEÇİRİLMESİ

  • Veri kümeleri – yapay zekaya kalıpları tanımayı ve bir şeyleri tahmin etmeyi öğretmek için kullanılan büyük veri kümeleri

  • Sensör – ortamdaki değişiklikleri algılayan ve bu bilgileri elektronik bir sistem içinde izlemek için kullanılan cihaz

  • Mikrodenetleyici – tek bir entegre çip üzerinde bulunan küçük bilgisayar, daha büyük bilgisayarlarda ve ev aletleri, araçlar ve robotlar gibi diğer sistemlerde kullanılır.

EK KAYNAKLAR

Donanım ve Sensörler


Sensörlerin kapsamlı bir listesi için şu Wikipedia makalesine.

Bu video, sensör kullanan projeler için önerdiğimiz mikrodenetleyici donanımı hakkında iyi bilgiler vermektedir.

Bu video eğitimi, Kaggle'da halka açık bir veri setine nasıl erişebileceğinizi gösterir.