AI: მონაცემთა ბაზა

  • გაიგებთ სხვადასხვა ტიპის მონაცემთა ბაზების შესახებ
  • დაიწყებთ მონაცემთა ბაზის დაგეგმვას თქვენი პროექტის AI მოდელისთვის, რომელიც რაღაცას იწინასწარმეტყველებს

ᲯᲐᲜᲡᲐᲦᲘ ᲛᲝᲜᲐᲪᲔᲛᲗᲐ ᲜᲐᲙᲠᲔᲑᲘ

პირველი ნაბიჯი AI მოდელის შესაქმნელად, რომელსაც შეუძლია რაიმეს კლასიფიკაცია, არის მონაცემთა ბაზის დაგეგმვა.

ჯანსაღი მონაცემთა ბაზა

მარჯვენა ისარი

ბევრი მონაცემი

მონაცემთა სხვადასხვა მაგალითი

სწორი ტიპის მონაცემები

მარჯვენა ისარი

სწორი მოქმედებები ან გადაწყვეტილებები

AI-Ს ᲔᲡᲐᲭᲘᲠᲝᲔᲑᲐ ᲛᲝᲜᲐᲪᲔᲛᲔᲑᲘ

თქვენი მონაცემთა ნაკრებისთვის მაგალითების შეგროვებისას გაითვალისწინეთ შემდეგი თვისებები.

ᲠᲐᲝᲓᲔᲜᲝᲑᲐ

რაც უფრო მეტი მაგალითის მოყვანა შეგიძლიათ მოდელისთვის, მით უკეთესი იქნება ის. მიეცით მინიმუმ 50 მაგალითი თითოეული კლასისთვის.

დაბალანსებული სასწორები

ᲑᲐᲚᲐᲜᲡᲘ

თქვენ უნდა გქონდეთ დაახლოებით იგივე რაოდენობის მაგალითები თითოეული კლასისთვის, რათა თავიდან აიცილოთ მიკერძოება ერთის მიმართ.

საქაღალდეები

ᲢᲔᲡᲢᲘᲡ ᲛᲝᲜᲐᲪᲔᲛᲔᲑᲘ

შეინახეთ თქვენი მაგალითების ნაწილი ცალკე მომზადებული მოდელის შესამოწმებლად. თქვენ დაგჭირდებათ რამდენიმე მაგალითი, რომელიც არ იყო გამოყენებული მოდელის მოსამზადებლად, რათა შეამოწმოთ, არის თუ არა თქვენი მოდელი ზუსტი.
მონაცემების 10-20% უნდა იყოს ტესტის მონაცემები.

ᲛᲠᲐᲕᲐᲚᲤᲔᲠᲝᲕᲜᲔᲑᲐ

თქვენ ასევე უნდა შეიტანოთ მრავალფეროვანი მაგალითები.

მაგალითად, ვთქვათ, რომ ქმნით ხელოვნური ინტელექტის მოდელს, რათა დაადგინოთ, ატარებს თუ არა ვინმეს სახის ნიღაბი. თქვენ უნდა შეაგროვოთ სურათები, რომლებიც ასახავს მრავალფეროვან მაგალითებს:

 

  • სხვადასხვა ტიპის და ფერის ნიღბები
  • სხვადასხვა ხალხი - სქესი, ეთნიკური წარმომავლობა, ასაკი
  • სხვადასხვა ფონი - შიდა, გარე, მსუბუქი, ბნელი
  • თავის სხვადასხვა კუთხეები
  • თავის განსხვავებული განლაგება ჩარჩოში - ახლოს, შორს, მარცხენა მხარეს, მარჯვენა მხარეს

რა მოხდება, თუ თქვენს მოდელს ავარჯიშებთ მხოლოდ ლურჯი ქირურგიული ნიღბების მატარებელთეთრი მამაკაცის სურათების გამოყენებით  თქვენი ნიღბის კლასისთვის? რა ხდება, როდესაც ფერადკანიანი ქალი, რომელსაც იისფერი ნიღაბი უკეთია, იყენებს თქვენს მოდელს? როგორ ფიქრობთ, კლასიფიცირდება? თქვენი მოდელი კარგად მუშაობს თუ არა?

აფროამერიკელი ქალი ნიღბით

ᲛᲝᲜᲐᲪᲔᲛᲗᲐ ᲢᲘᲞᲔᲑᲘ

მონაცემთა ბაზები ასევე სწორი ტიპის მონაცემებს უნდა შეიცავდეს. დარწმუნდით, რომ შეარჩიეთ მონაცემთა ტიპი, რომელიც შეესაბამება თქვენს პროექტს! ვარიანტებია:

Excel-ის ხატულა

რიცხვები

სტატისტიკური მონაცემები, დემოგრაფიული ინფორმაცია, სენსორული მონაცემები

ტექსტური დოკუმენტი

ტექსტი

შეტყობინებები, სოციალური მედიის პოსტები, წიგნები, სტატიები, ვებსაიტები

ხმის ტალღა

Sound

მუსიკა, ჩანაწერები, ხმები

გამოსახულების ხატები

სურათები

სახეები, ადგილები... ყველაფერი!

ხელოვნური ინტელექტი გაძლევთ ძალას

იმის განსაზღვრა, თუ რა შედის თქვენს მონაცემთა ბაზაში, გაძლევთუზარმაზარ ძალას!

ფრთხილად გამოიყენეთ და განსაზღვრეთ, რა შედის თქვენს მონაცემთა ბაზაში, რაც მოგცემთ უზარმაზარ ძალას !

ფრთხილად იყავით, ბევრი მონაცემის, განსხვავებული მონაცემებისა და სწორი ტიპის მონაცემების გამოყენებისას.

წინააღმდეგ შემთხვევაში, თქვენი AI მოდელი

  • არ იქნება ძალიან ზუსტი
  • შეიძლება ცუდი პროგნოზები გააკეთონ
  • არასწორად იმოქმედებს.

მონაცემების შესაგროვებლად და ჯანსაღი მონაცემთა ბაზისთვის დროის გამოყოფა აუცილებელია წარმატებული მოდელისთვის.

გოგონა მუშტით ჰაერში

ᲛᲝᲜᲐᲪᲔᲛᲗᲐ ᲨᲔᲒᲠᲝᲕᲔᲑᲐ

თქვენი მოდელის ტრენინგისთვის მონაცემთა შეგროვების 3 გზა არსებობს.

მეტი სენსორებზე

არსებობს ბევრი იაფი სენსორი, რომელსაც შეუძლია დაუკავშირდეს მცირე მიკროკონტროლერებს და თქვენს პროექტს მონაცემები მიაწოდოს. აქ მოცემულია რამდენიმე სენსორი, რომელიც შეიძლება გამოიყენოთ.

კამერა

Camera

სპიდომეტრი

მიკროფონი

სინათლის სენსორი

წნევის სენსორი

ჰაერის ხარისხის სენსორი

ინფრაწითელი თერმომეტრი

სიახლოვის სენსორი

აქტივობა: დაგეგმეთ თქვენი მონაცემთა ბაზა

სავარაუდო დრო: 45 წუთი

მიჰყევით სამუშაო ფურცელში მოცემულ ინსტრუქციებს, რათა გამოკვეთოთ:

  • რა მონაცემების შეგროვება გსურთ.
  • სად შეაგროვებთ მონაცემებს მონაცემთა ბაზისთვის. იქნება ეს საზოგადოება, სენსორები თუ მონაცემთა საჯარო კრებული?
  • როგორ შეაგროვებთ მონაცემებს? რა იქნება კლასები ან ლეიბლები თქვენი მოდელისთვის?
  • რამდენი მაგალითია თითოეული კლასისთვის? 50 მაგალითი კლასში მინიმუმი უნდა იყოს.
სამუშაო ფურცლის გახსნა

საუკეთესოპრაქტიკა:გაამხნევეთ მოსწავლეები, იფიქრონ იმ პრობლემებზე, რომლებიც მათ ყოველდღიურ ცხოვრებაში აქვთ, არსებობს თუ არა მონაცემთა კრებული მათ შესახებ? არის თუ არა რაიმე სენსორი თქვენს ირგვლივ არსებულ ნივთებში? რა სახის ინფორმაციას აგროვებენ ეს სენსორები? როგორ შეგიძლიათ გამოიყენოთ ისინი (გუგლის ახალ ტელეფონს აქვს ტემპერატურის სენსორი)?

სახელმძღვანელო კითხვები სტუდენტებისთვის:აქვს თუ არა თქვენს ქალაქს „ღია მონაცემების“ პორტალი? მაგალითი:ნიუ-იორკიდაედმონტონი, კანადა.

მენტორის რჩევები მოწოდებულია AmeriCorps-ის მხარდაჭერით.

სტილიზებული A, AmeriCorps-ის ლოგო საზღვაო ფლოტში

რეფლექსია

თქვენ ახლა გაქვთ მონაცემთა ბაზის გეგმა! როდესაც დაიწყებთ მაგალითების შეგროვებას თქვენი მონაცემთა ბაზისთვის, შეინახეთ ისინი უსაფრთხო და კარგად ორგანიზებულ ფაილში.

არ დაგავიწყდეთ მონაცემთა ბაზის ნაწილის სატესტოტ შენახვა! დაახლოებით 10-20% უნდა ინახებოდეს ცალკე ტესტირებისთვის.

ანარეკლი ტბაში

ძირითადი ტერმინების  მიმოხილვა

  • მონაცემთა ბაზა- მონაცემთა დიდი ერთობლიობა, რომელიც გამოიყენება ხელოვნური ინტელექტის მიერ შაბლონების ამოცნობასა და რაიმეს პროგნოზირებაში

  • სენსორი- მოწყობილობა, რომელსაც შეუძლია გარემოში ცვლილებების აღმოჩენა და ამ ინფორმაციის ელექტრონულ სისტემაში მონიტორინგი

  • მიკროკონტროლერი- პატარა კომპიუტერი ერთ ინტეგრირებულ ჩიპზე, რომელიც გამოიყენება უფრო დიდ კომპიუტერებში და სხვა სისტემებში, როგორიცაა გაჯეტები, მანქანები და რობოტები.

ᲓᲐᲛᲐᲢᲔᲑᲘᲗᲘ ᲠᲔᲡᲣᲠᲡᲔᲑᲘ

აპარატურა და სენსორები


სენსორების ყოვლისმომცველი ჩამონათვალისთვის იხილეთ ვიკიპედიის ეს სტატია .

ეს ვიდეო გვაწვდის კარგ ინფორმაციას მიკროკონტროლერის აპარატურის შესახებ, რომელსაც გირჩევთ სენსორებიან პროექტებში გამოსაყენებლად.

ეს ვიდეო გაკვეთილი გაჩვენებთ, თუ როგორ შეხვიდეთ Kaggle-ის საჯარო მონაცემთა ბაზაზე.