الذكاء الاصطناعي: مجموعات البيانات

  • تعرّف على أنواع مختلفة من مجموعات البيانات
  • ابدأ بتخطيط مجموعة البيانات لنموذج الذكاء الاصطناعي لمشروعك الذي سيتنبأ بشيء ما

مجموعات بيانات صحية

الخطوة الأولى في إنشاء نموذج ذكاء اصطناعي يمكنه تصنيف شيء ما هي تخطيط مجموعة البيانات.

مجموعات البيانات الصحية

السهم الأيمن

الكثير من البيانات

أمثلة مختلفة للبيانات

النوع الصحيح من البيانات

السهم الأيمن

الإجراءات أو القرارات الصحيحة

الذكاء الاصطناعي يحتاج إلى بيانات

ضع الصفات التالية في الاعتبار عند جمع الأمثلة لمجموعة البيانات الخاصة بك.

الكمية

كلما زاد عدد الأمثلة التي يمكنك تقديمها للنموذج، كان أداؤه أفضل. قدم 50 مثالاً على الأقل لكل فئة.

موازين متوازنة

الرصيد

يجب أن يكون لديك نفس العدد من الأمثلة تقريبًا لكل فئة، وذلك لمنع التحيز لأحدهما على الآخر.

المجلدات

بيانات الاختبار

احتفظ بجزء من الأمثلة الخاصة بك منفصلة لاختبار النموذج المدرّب. ستحتاج إلى بعض الأمثلة التي لم تُستخدم لتدريب النموذج لاختبار دقة نموذجك.
يجب أن تكون 10-20% من البيانات بيانات الاختبار.

التنوّع

تريد أيضًا تضمين أمثلة متنوعة.

على سبيل المثال، لنفترض أنك تنشئ نموذج ذكاء اصطناعي لاكتشاف ما إذا كان شخص ما يرتدي قناع وجه أم لا. يجب عليك جمع صور تعكس أمثلة متنوعة:

 

  • أنواع وألوان مختلفة من الأقنعة
  • الأشخاص المختلفون - من الجنسين والأعراق والأعمار المختلفة
  • خلفيات مختلفة - في الداخل، في الهواء الطلق، في الهواء الطلق، في الضوء، في الظلام
  • زوايا الرأس المختلفة
  • مواضع مختلفة للرأس في الإطار - قريب، بعيد، جانب أيسر، جانب أيمن

ماذا لو قمت بتدريب النموذج الخاص بك فقط باستخدام صور رجال بيض يرتدون أقنعة جراحية زرقاء لفئة الأقنعة الخاصة بك؟ ماذا يحدث عندما تستخدم أنثى ملونة ترتدي قناعاً أرجوانياً في نموذجك؟ كيف تعتقد أنه سيتم تصنيفها؟ هل سيكون أداء نموذجك جيداً أم لا؟

امرأة أمريكية من أصل أفريقي ترتدي قناعاً

أنواع البيانات

كما يجب أن تكون مجموعة البيانات من النوع الصحيح من البيانات. تأكد من اختيار نوع البيانات المناسب لمشروعك! الخيارات هي:

أيقونة إكسل

الأرقام

البيانات الإحصائية، والمعلومات الديموغرافية، وبيانات الاستشعار

مستند نصي

النص

الرسائل ومنشورات وسائل التواصل الاجتماعي والكتب والمقالات والمواقع الإلكترونية

الموجة الصوتية

الصوت

الموسيقى والتسجيلات والأصوات

أيقونات الصور

الصور

الوجوه والأماكن ... أي شيء!

الذكاء الاصطناعي يمنحك القوة

يمنحك تحديد ما يدخل في مجموعة بياناتك ما يلي قوة هائلة!

احرص على استخدام تحديد ما يدخل في مجموعة البيانات الخاصة بك يمنحك قوة هائلة!

احرص على استخدام الكثير من من البيانات مختلفة مختلفة، والنوع والنوع الصحيح من البيانات.

وإلا فإن نموذج الذكاء الاصطناعي الخاص بك

  • غير دقيق للغاية
  • يمكن أن تقدم تنبؤات سيئة
  • اتخاذ إجراء خاطئ.

إن أخذ الوقت الكافي لجمع البيانات التي من شأنها أن تشكل مجموعة بيانات سليمة أمر بالغ الأهمية لنجاح النموذج.

فتاة بقبضة في الهواء

جمع البيانات

هناك 3 طرق لجمع البيانات لتدريب النموذج الخاص بك.

المزيد عن المستشعرات

هناك العديد من المستشعرات منخفضة التكلفة التي يمكن توصيلها بوحدات تحكم صغيرة وتزويد مشروعك بالبيانات. فيما يلي بعض المستشعرات التي يمكن استخدامها.

كاميرا

كاميرا

عداد السرعة

ميكروفون

مستشعر الضوء

مستشعر الضغط

مستشعر جودة الهواء

ميزان حرارة بالأشعة تحت الحمراء

مستشعر القرب

النشاط: تخطيط مجموعة البيانات الخاصة بك

الوقت المقدر 45 دقيقة

اتبع الإرشادات الواردة في ورقة العمل لوضع الخطوط العريضة:

  • ما هي البيانات التي تريد جمعها.
  • أين ستجمع البيانات لمجموعة البيانات الخاصة بك. هل ستكون من المجتمع أو أجهزة الاستشعار أو مجموعات البيانات العامة؟
  • كيف ستجمع البيانات؟ ماذا ستكون الفئات أو التسميات لنموذجك؟
  • كم عدد الأمثلة لكل فصل؟ يجب أن يكون 50 لكل فصل كحد أدنى.
فتح ورقة العمل

أفضل الممارسات أفضل الممارسات: شجع الطلاب على التفكير في المشاكل التي يواجهونها في حياتهم اليومية، هل هناك مجموعة بيانات تتعلق بذلك؟ هل هناك أي مستشعرات في الأشياء من حولك؟ ما نوع المعلومات التي تجمعها هذه المستشعرات؟ كيف يمكنك استخدامها (هاتف جوجل الجديد يحتوي على مستشعر درجة الحرارة)؟

أسئلة إرشادية لطرحها على الطلاب هل لدى مدينتك بوابة "البيانات المفتوحة"؟ مثال: مدينة نيويورك و إدمونتون، كندا.

يتم توفير نصائح الموجهين من خلال الدعم المقدم من AmeriCorps.

حرف A منمق، شعار AmeriCorps باللون الكحلي

الانعكاس

لديك الآن خطة لمجموعة بياناتك! عندما تبدأ في جمع الأمثلة الخاصة بمجموعة البيانات الخاصة بك، حافظ عليها آمنة ومنظمة بشكل جيد.

لا تنسَ الاحتفاظ بجزء من مجموعة البيانات للاختبار! يجب الاحتفاظ بحوالي 10-20% منها منفصلة للاختبار.

انعكاس في البحيرة

مراجعة المصطلحات الرئيسية

  • مجموعات البيانات - مجموعات كبيرة من البيانات التي تُستخدم لتعليم الذكاء الاصطناعي التعرف على الأنماط والتنبؤ بشيء ما

  • جهاز استشعار - جهاز يكتشف التغيرات في البيئة ويستخدم لمراقبة تلك المعلومات داخل نظام إلكتروني

  • متحكم دقيق - كمبيوتر صغير على شريحة واحدة متكاملة، يستخدم في أجهزة الكمبيوتر الكبيرة والأنظمة الأخرى مثل الأجهزة والمركبات والروبوتات

الموارد الإضافية

الأجهزة والمستشعرات


للاطلاع على قائمة شاملة لأجهزة الاستشعار، راجع هذا مقالة ويكيبيديا.

يقدم هذا الفيديو معلومات جيدة عن أجهزة المتحكم الدقيق التي نوصي بها للمشاريع التي تستخدم المستشعرات.

يوضح لك هذا الفيديو التعليمي كيفية الوصول إلى مجموعة بيانات عامة على Kaggle.