- למד על סוגים שונים של מערכי נתונים
- התחל לתכנן את מערך הנתונים עבור מודל ה-AI של הפרויקט שלך שיחזה משהו
אלו הפעילויות לשיעור זה:
מערכי נתונים בריאים
הצעד הראשון ביצירת מודל AI שיכול לסווג משהו הוא לתכנן את מערך הנתונים.
מערכי נתונים בריאים

הרבה נתונים
דוגמאות שונות של נתונים
הסוג הנכון של נתונים

פעולות או החלטות נכונות
AI זקוק לנתונים
זכור את התכונות הבאות בעת איסוף דוגמאות עבור מערך הנתונים שלך.

כַּמוּת
ככל שתוכלו לתת יותר דוגמאות למודל, כך הוא ישתפר. ספק לפחות 50 דוגמאות לכל כיתה.

לְאַזֵן
צריך להיות לך בערך אותו מספר של דוגמאות עבור כל מחלקה, כדי למנוע הטיה של אחת על השנייה.

נתוני בדיקה
שמור חלק מהדוגמאות שלך נפרדות כדי לבדוק את המודל המאומן. תזדקק לכמה דוגמאות שלא שימשו לאימון המודל כדי לבדוק אם המודל שלך מדויק.
10-20% מהנתונים צריכים להיות נתוני בדיקה.
גיוון
אתה גם רוצה לכלול דוגמאות מגוונות.
לדוגמה, נניח שאתה יוצר מודל AI כדי לזהות אם מישהו חובש מסיכת פנים או לא. כדאי לאסוף תמונות המשקפות דוגמאות מגוונות:
- סוגים וצבעים שונים של מסכות
- אנשים שונים - מגדרים, עדות, גילאים
- רקעים שונים - בתוך הבית, בחוץ, בהיר, כהה
- זוויות ראש שונות
- מיקום שונה של הראש במסגרת - קרוב, רחוק, צד שמאל, צד ימין

מה אם אימנת רק את הדוגמנית שלך באמצעות תמונות של גברים לבנים עם מסכות כירורגיות כחולות לשיעור המסכות שלך? מה קורה כשנקבה צבעונית שלובשת מסכה סגולה משתמשת בדגם שלך? איך לדעתך זה יסווג? האם הדגם שלך יצליח או לא?


סוגי נתונים
מערך נתונים חייב להיות גם הסוג הנכון של נתונים. ודא שאתה בוחר את סוג הנתונים המתאים לפרויקט שלך! האפשרויות הן:

מספרים
נתונים סטטיסטיים, מידע דמוגרפי, נתוני חיישנים

טֶקסט
הודעות, פוסטים ברשתות חברתיות, ספרים, מאמרים, אתרי אינטרנט

קוֹל
מוזיקה, הקלטות, קולות

תמונות
פרצופים, מקומות... כל דבר!
AI נותן לך כוח
קביעה מה נכנס למערך הנתונים שלך מעניקה לך כוח עצום !
היזהר להשתמש בקביעה מה נכנס למערך הנתונים שלך נותן לך כוח עצום !
היזהר להשתמש בהרבה נתונים, נתונים שונים וסוג הנתונים הנכון .
אחרת, דגם הבינה המלאכותית שלך יעשה זאת
- לא להיות מאוד מדויק
- יכול לעשות תחזיות גרועות
- לעשות את הפעולה הלא נכונה.
הקדשת זמן לאיסוף נתונים שיהוו מערך נתונים בריא הוא קריטי למודל מוצלח.

איסוף נתונים
ישנן 3 דרכים לאסוף נתונים לאימון המודל שלך.
אם הפרויקט שלך מתמקד ישירות בקהילה שלך, הקהילה עשויה להפוך את המקום ההגיוני לספק את הנתונים שאתה צריך. ודא שיש לך הרשאה להשתמש בנתונים!
איך יאסוף נתונים בקהילה שלך?
- לְצַלֵם?
- לבקש מחברי הקהילה לתת לך תמונות?
- להקליט צלילים?
- להשתמש בסקר?
- לראיין חברי קהילה?
אם אתה הולך להזדקק להרבה מאוד נתונים עבור המודל שלך, אתה יכול לבדוק מערכי נתונים ציבוריים. ישנם מערכי נתונים רבים זמינים באינטרנט שיכולים לספק לך כמויות גדולות של נתונים במהירות.
הנה כמה אתרי נתונים טובים:
הקפד לבדוק את הנתונים כדי לוודא שהם מתאימים לקריטריונים שלמעלה עבור מערך נתונים בריא.
סביר להניח שתצטרך גם לבצע כמה שינויים בנתונים כדי להתאים לצרכים שלך. לדוגמה, כלים כמו Teachable Machine דורשים תמונות מרובעות, לכן ייתכן שיהיה עליך לערוך את תמונות מערך הנתונים כך שיתאימו למידות הנכונות עבור הכלי שבו אתה משתמש.
מיקרו-בקרים הם מחשבים קטנים על מעגל משולב יחיד המשמשים לשליטה במכשירים כמו מנועי רכב ומכשירי חשמל ביתיים. בחלק מהמיקרו-בקרים יש חיישנים מובנים. לרבים יש אפשרויות לחבר אליהם חיישנים.
כל אחד מ שלושת המיקרו-בקרים המומלצים להלן יש תכונות מיוחדות משלו, והוא עשוי לדרוש שימוש בשפות תכנות שונות כדי לגרום להן לעבוד עבור הפרויקט שלך. לחלק מהכלים, כמו App Inventor, יש הרחבות שאתה יכול להוסיף כדי שתוכל להשתמש במכשירים האלה עם הכלים האלה. כל שלושת המכשירים הוסיפו לאחרונה יכולת AI, אז אתה רוצה לבדוק מה אפשרי!
עוד על חיישנים
ישנם חיישנים רבים בעלות נמוכה שיכולים להתחבר למיקרו-בקרים קטנים ולספק לפרויקט שלך נתונים. הנה כמה חיישנים שניתן להשתמש בהם.

מַצלֵמָה

מַד מְהִירוּת

מִיקרוֹפוֹן

חיישן אור

חיישן לחץ

חיישן איכות אוויר

מדחום אינפרא אדום

חיישן קירבה
פעילות: תכנן את מערך הנתונים שלך
עקוב אחר ההוראות בגיליון העבודה כדי לתאר:
- אילו נתונים אתה רוצה לאסוף.
- היכן תאסוף את הנתונים עבור מערך הנתונים שלך. האם זה יהיה קהילה, חיישנים או מערכי נתונים ציבוריים?
- איך תאסוף את הנתונים? מה יהיו השיעורים או התוויות עבור הדגם שלך?
- כמה דוגמאות לכל כיתה? 50 לכיתה צריך להיות מינימום.
טיפ מנטור
שיטות עבודה מומלצות : עודדו את התלמידים לחשוב על הבעיות שיש להם בחיי היום יום שלהם, האם יש סט נתונים שמתייחס לכך? האם יש חיישנים בחפצים סביבך? איזה סוג מידע חיישנים אלו אוספים? איך אתה יכול להשתמש בהם (לטלפון גוגל החדש יש חיישן טמפרטורה)?
שאלות מנחות לשאול תלמידים: האם לעיר שלך יש פורטל "נתונים פתוחים"? דוגמה: ניו יורק ואדמונטון , קנדה .
טיפים למנטורים ניתנים על ידי תמיכה מ-AmeriCorps.

הִשׁתַקְפוּת
כעת יש לך תוכנית עבור מערך הנתונים שלך! כשאתה מתחיל לאסוף את הדוגמאות עבור מערך הנתונים שלך, שמור אותן בטוחות ומאורגנות היטב.
אל תשכח לשמור חלק ממערך הנתונים לבדיקה! יש להפריד כ-10-20% לבדיקה.

סקירה של תנאים עיקריים
מערכי נתונים - סטים גדולים של נתונים המשמשים כדי ללמד AI לזהות דפוסים ולחזות משהו
חיישן – מכשיר המזהה שינויים בסביבה ומשמש לניטור מידע זה בתוך מערכת אלקטרונית
מיקרו-בקר - מחשב קטן על שבב משולב יחיד, המשמש במחשבים גדולים יותר ומערכות אחרות כגון מכשירי חשמל, כלי רכב ורובוטים
משאבים נוספים
חומרה וחיישנים
לרשימה מקיפה של חיישנים, עיין במאמר זה בוויקיפדיה .
סרטון זה נותן מידע טוב על חומרת המיקרו-בקר שאנו ממליצים על פרויקטים המשתמשים בחיישנים.
מדריך וידאו זה מראה לך כיצד לגשת למערך נתונים ציבורי ב- Kaggle.