AI: מערכי נתונים

  • למד על סוגים שונים של מערכי נתונים
  • התחל לתכנן את מערך הנתונים עבור מודל ה-AI של הפרויקט שלך שיחזה משהו

מערכי נתונים בריאים

הצעד הראשון ביצירת מודל AI שיכול לסווג משהו הוא לתכנן את מערך הנתונים.

מערכי נתונים בריאים

חץ ימינה

הרבה נתונים

דוגמאות שונות של נתונים

הסוג הנכון של נתונים

חץ ימינה

פעולות או החלטות נכונות

AI זקוק לנתונים

זכור את התכונות הבאות בעת איסוף דוגמאות עבור מערך הנתונים שלך.

כַּמוּת

ככל שתוכלו לתת יותר דוגמאות למודל, כך הוא ישתפר. ספק לפחות 50 דוגמאות לכל כיתה.

מאזניים מאוזנים

לְאַזֵן

צריך להיות לך בערך אותו מספר של דוגמאות עבור כל מחלקה, כדי למנוע הטיה של אחת על השנייה.

תיקיות

נתוני בדיקה

שמור חלק מהדוגמאות שלך נפרדות כדי לבדוק את המודל המאומן. תזדקק לכמה דוגמאות שלא שימשו לאימון המודל כדי לבדוק אם המודל שלך מדויק.
10-20% מהנתונים צריכים להיות נתוני בדיקה.

גיוון

אתה גם רוצה לכלול דוגמאות מגוונות.

לדוגמה, נניח שאתה יוצר מודל AI כדי לזהות אם מישהו חובש מסיכת פנים או לא. כדאי לאסוף תמונות המשקפות דוגמאות מגוונות:

 

  • סוגים וצבעים שונים של מסכות
  • אנשים שונים - מגדרים, עדות, גילאים
  • רקעים שונים - בתוך הבית, בחוץ, בהיר, כהה
  • זוויות ראש שונות
  • מיקום שונה של הראש במסגרת - קרוב, רחוק, צד שמאל, צד ימין

מה אם אימנת רק את הדוגמנית שלך באמצעות תמונות של גברים לבנים עם מסכות כירורגיות כחולות לשיעור המסכות שלך? מה קורה כשנקבה צבעונית שלובשת מסכה סגולה משתמשת בדגם שלך? איך לדעתך זה יסווג? האם הדגם שלך יצליח או לא?

אישה אפרו אמריקאית עם מסכה

סוגי נתונים

מערך נתונים חייב להיות גם הסוג הנכון של נתונים. ודא שאתה בוחר את סוג הנתונים המתאים לפרויקט שלך! האפשרויות הן:

סמל אקסל

מספרים

נתונים סטטיסטיים, מידע דמוגרפי, נתוני חיישנים

מסמך טקסט

טֶקסט

הודעות, פוסטים ברשתות חברתיות, ספרים, מאמרים, אתרי אינטרנט

גל קול

קוֹל

מוזיקה, הקלטות, קולות

אייקוני תמונה

תמונות

פרצופים, מקומות... כל דבר!

AI נותן לך כוח

קביעה מה נכנס למערך הנתונים שלך מעניקה לך כוח עצום !

היזהר להשתמש בקביעה מה נכנס למערך הנתונים שלך נותן לך כוח עצום !

היזהר להשתמש בהרבה נתונים, נתונים שונים וסוג הנתונים הנכון .

אחרת, דגם הבינה המלאכותית שלך יעשה זאת

  • לא להיות מאוד מדויק
  • יכול לעשות תחזיות גרועות
  • לעשות את הפעולה הלא נכונה.

הקדשת זמן לאיסוף נתונים שיהוו מערך נתונים בריא הוא קריטי למודל מוצלח.

ילדה עם אגרוף באוויר

איסוף נתונים

ישנן 3 דרכים לאסוף נתונים לאימון המודל שלך.

עוד על חיישנים

ישנם חיישנים רבים בעלות נמוכה שיכולים להתחבר למיקרו-בקרים קטנים ולספק לפרויקט שלך נתונים. הנה כמה חיישנים שניתן להשתמש בהם.

מַצלֵמָה

מַצלֵמָה

מַד מְהִירוּת

מִיקרוֹפוֹן

חיישן אור

חיישן לחץ

חיישן איכות אוויר

מדחום אינפרא אדום

חיישן קירבה

פעילות: תכנן את מערך הנתונים שלך

זמן משוער: 45 דקות

עקוב אחר ההוראות בגיליון העבודה כדי לתאר:

  • אילו נתונים אתה רוצה לאסוף.
  • היכן תאסוף את הנתונים עבור מערך הנתונים שלך. האם זה יהיה קהילה, חיישנים או מערכי נתונים ציבוריים?
  • איך תאסוף את הנתונים? מה יהיו השיעורים או התוויות עבור הדגם שלך?
  • כמה דוגמאות לכל כיתה? 50 לכיתה צריך להיות מינימום.
פתח גליון עבודה

שיטות עבודה מומלצות : עודדו את התלמידים לחשוב על הבעיות שיש להם בחיי היום יום שלהם, האם יש סט נתונים שמתייחס לכך? האם יש חיישנים בחפצים סביבך? איזה סוג מידע חיישנים אלו אוספים? איך אתה יכול להשתמש בהם (לטלפון גוגל החדש יש חיישן טמפרטורה)?

שאלות מנחות לשאול תלמידים: האם לעיר שלך יש פורטל "נתונים פתוחים"? דוגמה: ניו יורק ואדמונטון , קנדה .

טיפים למנטורים ניתנים על ידי תמיכה מ-AmeriCorps.

A מסוגנן, לוגו AmeriCorps בצי

הִשׁתַקְפוּת

כעת יש לך תוכנית עבור מערך הנתונים שלך! כשאתה מתחיל לאסוף את הדוגמאות עבור מערך הנתונים שלך, שמור אותן בטוחות ומאורגנות היטב.

אל תשכח לשמור חלק ממערך הנתונים לבדיקה! יש להפריד כ-10-20% לבדיקה.

השתקפות באגם

סקירה של תנאים עיקריים

  • מערכי נתונים - סטים גדולים של נתונים המשמשים כדי ללמד AI לזהות דפוסים ולחזות משהו

  • חיישן – מכשיר המזהה שינויים בסביבה ומשמש לניטור מידע זה בתוך מערכת אלקטרונית

  • מיקרו-בקר - מחשב קטן על שבב משולב יחיד, המשמש במחשבים גדולים יותר ומערכות אחרות כגון מכשירי חשמל, כלי רכב ורובוטים

משאבים נוספים

חומרה וחיישנים


לרשימה מקיפה של חיישנים, עיין במאמר זה בוויקיפדיה .

סרטון זה נותן מידע טוב על חומרת המיקרו-בקר שאנו ממליצים על פרויקטים המשתמשים בחיישנים.

מדריך וידאו זה מראה לך כיצד לגשת למערך נתונים ציבורי ב- Kaggle.