- გაიგებთ სხვადასხვა ტიპის მონაცემთა ბაზების შესახებ
- დაიწყებთ მონაცემთა ბაზის დაგეგმვას თქვენი პროექტის AI მოდელისთვის, რომელიც რაღაცას იწინასწარმეტყველებს
აქტივობები ამ გაკვეთილისთვის:
ᲯᲐᲜᲡᲐᲦᲘ ᲛᲝᲜᲐᲪᲔᲛᲗᲐ ᲜᲐᲙᲠᲔᲑᲘ
პირველი ნაბიჯი AI მოდელის შესაქმნელად, რომელსაც შეუძლია რაიმეს კლასიფიკაცია, არის მონაცემთა ბაზის დაგეგმვა.
ჯანსაღი მონაცემთა ბაზა

ბევრი მონაცემი
მონაცემთა სხვადასხვა მაგალითი
სწორი ტიპის მონაცემები

სწორი მოქმედებები ან გადაწყვეტილებები
AI-Ს ᲔᲡᲐᲭᲘᲠᲝᲔᲑᲐ ᲛᲝᲜᲐᲪᲔᲛᲔᲑᲘ
თქვენი მონაცემთა ნაკრებისთვის მაგალითების შეგროვებისას გაითვალისწინეთ შემდეგი თვისებები.

ᲠᲐᲝᲓᲔᲜᲝᲑᲐ
რაც უფრო მეტი მაგალითის მოყვანა შეგიძლიათ მოდელისთვის, მით უკეთესი იქნება ის. მიეცით მინიმუმ 50 მაგალითი თითოეული კლასისთვის.

ᲑᲐᲚᲐᲜᲡᲘ
თქვენ უნდა გქონდეთ დაახლოებით იგივე რაოდენობის მაგალითები თითოეული კლასისთვის, რათა თავიდან აიცილოთ მიკერძოება ერთის მიმართ.

ᲢᲔᲡᲢᲘᲡ ᲛᲝᲜᲐᲪᲔᲛᲔᲑᲘ
შეინახეთ თქვენი მაგალითების ნაწილი ცალკე მომზადებული მოდელის შესამოწმებლად. თქვენ დაგჭირდებათ რამდენიმე მაგალითი, რომელიც არ იყო გამოყენებული მოდელის მოსამზადებლად, რათა შეამოწმოთ, არის თუ არა თქვენი მოდელი ზუსტი.
მონაცემების 10-20% უნდა იყოს ტესტის მონაცემები.
ᲛᲠᲐᲕᲐᲚᲤᲔᲠᲝᲕᲜᲔᲑᲐ
თქვენ ასევე უნდა შეიტანოთ მრავალფეროვანი მაგალითები.
მაგალითად, ვთქვათ, რომ ქმნით ხელოვნური ინტელექტის მოდელს, რათა დაადგინოთ, ატარებს თუ არა ვინმეს სახის ნიღაბი. თქვენ უნდა შეაგროვოთ სურათები, რომლებიც ასახავს მრავალფეროვან მაგალითებს:
- სხვადასხვა ტიპის და ფერის ნიღბები
- სხვადასხვა ხალხი - სქესი, ეთნიკური წარმომავლობა, ასაკი
- სხვადასხვა ფონი - შიდა, გარე, მსუბუქი, ბნელი
- თავის სხვადასხვა კუთხეები
- თავის განსხვავებული განლაგება ჩარჩოში - ახლოს, შორს, მარცხენა მხარეს, მარჯვენა მხარეს

რა მოხდება, თუ თქვენს მოდელს ავარჯიშებთ მხოლოდ ლურჯი ქირურგიული ნიღბების მატარებელთეთრი მამაკაცის სურათების გამოყენებით თქვენი ნიღბის კლასისთვის? რა ხდება, როდესაც ფერადკანიანი ქალი, რომელსაც იისფერი ნიღაბი უკეთია, იყენებს თქვენს მოდელს? როგორ ფიქრობთ, კლასიფიცირდება? თქვენი მოდელი კარგად მუშაობს თუ არა?


ᲛᲝᲜᲐᲪᲔᲛᲗᲐ ᲢᲘᲞᲔᲑᲘ
მონაცემთა ბაზები ასევე სწორი ტიპის მონაცემებს უნდა შეიცავდეს. დარწმუნდით, რომ შეარჩიეთ მონაცემთა ტიპი, რომელიც შეესაბამება თქვენს პროექტს! ვარიანტებია:

რიცხვები
სტატისტიკური მონაცემები, დემოგრაფიული ინფორმაცია, სენსორული მონაცემები

ტექსტი
შეტყობინებები, სოციალური მედიის პოსტები, წიგნები, სტატიები, ვებსაიტები

Sound
მუსიკა, ჩანაწერები, ხმები

სურათები
სახეები, ადგილები... ყველაფერი!
ხელოვნური ინტელექტი გაძლევთ ძალას
იმის განსაზღვრა, თუ რა შედის თქვენს მონაცემთა ბაზაში, გაძლევთუზარმაზარ ძალას!
ფრთხილად გამოიყენეთ და განსაზღვრეთ, რა შედის თქვენს მონაცემთა ბაზაში, რაც მოგცემთ უზარმაზარ ძალას !
ფრთხილად იყავით, ბევრი მონაცემის, განსხვავებული მონაცემებისა და სწორი ტიპის მონაცემების გამოყენებისას.
წინააღმდეგ შემთხვევაში, თქვენი AI მოდელი
- არ იქნება ძალიან ზუსტი
- შეიძლება ცუდი პროგნოზები გააკეთონ
- არასწორად იმოქმედებს.
მონაცემების შესაგროვებლად და ჯანსაღი მონაცემთა ბაზისთვის დროის გამოყოფა აუცილებელია წარმატებული მოდელისთვის.

ᲛᲝᲜᲐᲪᲔᲛᲗᲐ ᲨᲔᲒᲠᲝᲕᲔᲑᲐ
თქვენი მოდელის ტრენინგისთვის მონაცემთა შეგროვების 3 გზა არსებობს.
თუ თქვენი პროექტი პირდაპირ კონცენტრირდება საზოგადოებაზე, საზოგადოებამ შესაძლოა ლოგიკური ადგილი დაიკაოს თქვენთვის საჭირო მონაცემების მოწოდებაში. დარწმუნდით, რომ გაქვთ მონაცემების გამოყენების ნებართვა!
როგორ შეაგროვებთ მონაცემებს თქვენს საზოგადოებაში?
- სურათების გადაიღებთ?
- სთხოვთ საზოგადოების წევრებს მოგაწოდოთ სურათები?
- ხმების ჩაწერით?
- გამოკითხვის გამოყენებით?
- საზოგადოების წევრებთანინტერვიუს ჩაწერით?
თუ გჭირდებათ ძალიან ბევრი მონაცემი თქვენი მოდელისთვის, შეგიძლიათ გადახედოთ საჯარო მონაცემთა ბაზას. ინტერნეტში ხელმისაწვდომია მონაცემთა მრავალი კრებული, რომლებიც სწრაფად მოგაწვდით დიდი რაოდენობით მონაცემს.
აქ მოცემულია მონაცემთა ბაზის რამდენიმე კარგი საიტი:
გადახედეთ მონაცემებს, რათა დარწმუნდეთ, რომ ისინი შეესაბამება ზემოთ მოცემულ კრიტერიუმებს ჯანსაღი მონაცემთა ბაზისთვის.
თქვენ ასევე მოგიწევთ თქვენივე საჭიროებებზე მორგებული ცვლილებების შეტანა მონაცემებში. მაგალითად, ინსტრუმენტები, როგორიცაა Teachable Machine, მოითხოვს კვადრატულ სურათებს, ასე რომ თქვენ შეიძლება დაგჭირდეთ მონაცემთა ბაზის სურათების რედაქტირება სწორ ხელსაწყოზე მოსარგებად.
მიკროკონტროლერები არის პატარა კომპიუტერები ერთ ინტეგრირებულ წრედზე, რომლებიც გამოიყენება ისეთი მოწყობილობების გასაკონტროლებლად, როგორიცაა საავტომობილო ძრავები და საყოფაცხოვრებო ტექნიკა. ზოგიერთ მიკროკონტროლერს აქვს ჩაშენებული სენსორები. ბევრს აქვს სენსორების მათთან დაკავშირების ვარიანტები.
თითოეული ქვემოთ მოცემულ სამ რეკომენდებულ მიკროკონტროლერს აქვს თავიანთი სპეციფიკური ფუნქციები და შეიძლება თქვენს პროექტზე სამუშაოდ შეიძლება საჭირო გახდეს სხვადასხვა პროგამირების ენის გამოყენება. ზოგიერთ ინსტრუმენტს, როგორიცაა App Inventor, აქვს გაფართოებები,რომელთა დამატებითაც შესაძლებელია ამ მოწყობილობების გამოყენება იმ ინსტრუმენტებით. სამივე მოწყობილობას ახლახან დაემატა AI, ასე რომ შეამოწმეთ რა არის შესაძლებელი!
მეტი სენსორებზე
არსებობს ბევრი იაფი სენსორი, რომელსაც შეუძლია დაუკავშირდეს მცირე მიკროკონტროლერებს და თქვენს პროექტს მონაცემები მიაწოდოს. აქ მოცემულია რამდენიმე სენსორი, რომელიც შეიძლება გამოიყენოთ.

Camera

სპიდომეტრი

მიკროფონი

სინათლის სენსორი

წნევის სენსორი

ჰაერის ხარისხის სენსორი

ინფრაწითელი თერმომეტრი

სიახლოვის სენსორი
აქტივობა: დაგეგმეთ თქვენი მონაცემთა ბაზა
მიჰყევით სამუშაო ფურცელში მოცემულ ინსტრუქციებს, რათა გამოკვეთოთ:
- რა მონაცემების შეგროვება გსურთ.
- სად შეაგროვებთ მონაცემებს მონაცემთა ბაზისთვის. იქნება ეს საზოგადოება, სენსორები თუ მონაცემთა საჯარო კრებული?
- როგორ შეაგროვებთ მონაცემებს? რა იქნება კლასები ან ლეიბლები თქვენი მოდელისთვის?
- რამდენი მაგალითია თითოეული კლასისთვის? 50 მაგალითი კლასში მინიმუმი უნდა იყოს.
მენტორის რჩევა
საუკეთესოპრაქტიკა:გაამხნევეთ მოსწავლეები, იფიქრონ იმ პრობლემებზე, რომლებიც მათ ყოველდღიურ ცხოვრებაში აქვთ, არსებობს თუ არა მონაცემთა კრებული მათ შესახებ? არის თუ არა რაიმე სენსორი თქვენს ირგვლივ არსებულ ნივთებში? რა სახის ინფორმაციას აგროვებენ ეს სენსორები? როგორ შეგიძლიათ გამოიყენოთ ისინი (გუგლის ახალ ტელეფონს აქვს ტემპერატურის სენსორი)?
სახელმძღვანელო კითხვები სტუდენტებისთვის:აქვს თუ არა თქვენს ქალაქს „ღია მონაცემების“ პორტალი? მაგალითი:ნიუ-იორკიდაედმონტონი, კანადა.
მენტორის რჩევები მოწოდებულია AmeriCorps-ის მხარდაჭერით.

რეფლექსია
თქვენ ახლა გაქვთ მონაცემთა ბაზის გეგმა! როდესაც დაიწყებთ მაგალითების შეგროვებას თქვენი მონაცემთა ბაზისთვის, შეინახეთ ისინი უსაფრთხო და კარგად ორგანიზებულ ფაილში.
არ დაგავიწყდეთ მონაცემთა ბაზის ნაწილის სატესტოტ შენახვა! დაახლოებით 10-20% უნდა ინახებოდეს ცალკე ტესტირებისთვის.

ძირითადი ტერმინების მიმოხილვა
მონაცემთა ბაზა- მონაცემთა დიდი ერთობლიობა, რომელიც გამოიყენება ხელოვნური ინტელექტის მიერ შაბლონების ამოცნობასა და რაიმეს პროგნოზირებაში
სენსორი- მოწყობილობა, რომელსაც შეუძლია გარემოში ცვლილებების აღმოჩენა და ამ ინფორმაციის ელექტრონულ სისტემაში მონიტორინგი
მიკროკონტროლერი- პატარა კომპიუტერი ერთ ინტეგრირებულ ჩიპზე, რომელიც გამოიყენება უფრო დიდ კომპიუტერებში და სხვა სისტემებში, როგორიცაა გაჯეტები, მანქანები და რობოტები.
ᲓᲐᲛᲐᲢᲔᲑᲘᲗᲘ ᲠᲔᲡᲣᲠᲡᲔᲑᲘ
აპარატურა და სენსორები
სენსორების ყოვლისმომცველი ჩამონათვალისთვის იხილეთ ვიკიპედიის ეს სტატია .
ეს ვიდეო გვაწვდის კარგ ინფორმაციას მიკროკონტროლერის აპარატურის შესახებ, რომელსაც გირჩევთ სენსორებიან პროექტებში გამოსაყენებლად.
ეს ვიდეო გაკვეთილი გაჩვენებთ, თუ როგორ შეხვიდეთ Kaggle-ის საჯარო მონაცემთა ბაზაზე.