- تعرّف على أنواع مختلفة من مجموعات البيانات
- ابدأ بتخطيط مجموعة البيانات لنموذج الذكاء الاصطناعي لمشروعك الذي سيتنبأ بشيء ما
هذه هي أنشطة هذا الدرس:
مجموعات بيانات صحية
الخطوة الأولى في إنشاء نموذج ذكاء اصطناعي يمكنه تصنيف شيء ما هي تخطيط مجموعة البيانات.
مجموعات البيانات الصحية

الكثير من البيانات
أمثلة مختلفة للبيانات
النوع الصحيح من البيانات

الإجراءات أو القرارات الصحيحة
الذكاء الاصطناعي يحتاج إلى بيانات
ضع الصفات التالية في الاعتبار عند جمع الأمثلة لمجموعة البيانات الخاصة بك.

الكمية
كلما زاد عدد الأمثلة التي يمكنك تقديمها للنموذج، كان أداؤه أفضل. قدم 50 مثالاً على الأقل لكل فئة.

الرصيد
يجب أن يكون لديك نفس العدد من الأمثلة تقريبًا لكل فئة، وذلك لمنع التحيز لأحدهما على الآخر.

بيانات الاختبار
احتفظ بجزء من الأمثلة الخاصة بك منفصلة لاختبار النموذج المدرّب. ستحتاج إلى بعض الأمثلة التي لم تُستخدم لتدريب النموذج لاختبار دقة نموذجك.
يجب أن تكون 10-20% من البيانات بيانات الاختبار.
التنوّع
تريد أيضًا تضمين أمثلة متنوعة.
على سبيل المثال، لنفترض أنك تنشئ نموذج ذكاء اصطناعي لاكتشاف ما إذا كان شخص ما يرتدي قناع وجه أم لا. يجب عليك جمع صور تعكس أمثلة متنوعة:
- أنواع وألوان مختلفة من الأقنعة
- الأشخاص المختلفون - من الجنسين والأعراق والأعمار المختلفة
- خلفيات مختلفة - في الداخل، في الهواء الطلق، في الهواء الطلق، في الضوء، في الظلام
- زوايا الرأس المختلفة
- مواضع مختلفة للرأس في الإطار - قريب، بعيد، جانب أيسر، جانب أيمن

ماذا لو قمت بتدريب النموذج الخاص بك فقط باستخدام صور رجال بيض يرتدون أقنعة جراحية زرقاء لفئة الأقنعة الخاصة بك؟ ماذا يحدث عندما تستخدم أنثى ملونة ترتدي قناعاً أرجوانياً في نموذجك؟ كيف تعتقد أنه سيتم تصنيفها؟ هل سيكون أداء نموذجك جيداً أم لا؟


أنواع البيانات
كما يجب أن تكون مجموعة البيانات من النوع الصحيح من البيانات. تأكد من اختيار نوع البيانات المناسب لمشروعك! الخيارات هي:

الأرقام
البيانات الإحصائية، والمعلومات الديموغرافية، وبيانات الاستشعار

النص
الرسائل ومنشورات وسائل التواصل الاجتماعي والكتب والمقالات والمواقع الإلكترونية

الصوت
الموسيقى والتسجيلات والأصوات

الصور
الوجوه والأماكن ... أي شيء!
الذكاء الاصطناعي يمنحك القوة
يمنحك تحديد ما يدخل في مجموعة بياناتك ما يلي قوة هائلة!
احرص على استخدام تحديد ما يدخل في مجموعة البيانات الخاصة بك يمنحك قوة هائلة!
احرص على استخدام الكثير من من البيانات مختلفة مختلفة، والنوع والنوع الصحيح من البيانات.
وإلا فإن نموذج الذكاء الاصطناعي الخاص بك
- غير دقيق للغاية
- يمكن أن تقدم تنبؤات سيئة
- اتخاذ إجراء خاطئ.
إن أخذ الوقت الكافي لجمع البيانات التي من شأنها أن تشكل مجموعة بيانات سليمة أمر بالغ الأهمية لنجاح النموذج.

جمع البيانات
هناك 3 طرق لجمع البيانات لتدريب النموذج الخاص بك.
إذا كان مشروعك يركز بشكل مباشر على مجتمعك، فقد يكون المجتمع هو المكان المنطقي لتوفير البيانات التي تحتاجها. تأكد من حصولك على إذن لاستخدام البيانات!
كيف سيتم جمع البيانات في مجتمعك؟
- التقاط الصور؟
- اطلب من أفراد المجتمع أن يقدموا لك صورًا؟
- تسجيل الأصوات؟
- استخدام الاستبيان؟
- مقابلة أفراد المجتمع؟
إذا كنت ستحتاج إلى الكثير والكثير من البيانات لنموذجك، يمكنك البحث في مجموعات البيانات العامة. هناك العديد من مجموعات البيانات المتاحة على الإنترنت والتي يمكن أن توفر لك كميات كبيرة من البيانات بسرعة.
إليك بعض مواقع مجموعات البيانات الجيدة:
تأكد من مراجعة البيانات للتأكد من مطابقتها للمعايير المذكورة أعلاه للحصول على مجموعة بيانات سليمة.
سيتعين عليك على الأرجح أيضًا إجراء بعض التغييرات على البيانات لتناسب احتياجاتك. على سبيل المثال، تتطلب أدوات مثل "الآلة القابلة للتعليم" صورًا مربعة، لذا قد تحتاج إلى تعديل صور مجموعة البيانات لتناسب الأبعاد الصحيحة للأداة التي تستخدمها.
المتحكمات الدقيقة هي أجهزة كمبيوتر صغيرة على دائرة متكاملة واحدة تستخدم للتحكم في أجهزة مثل محركات السيارات والأجهزة المنزلية. تحتوي بعض المتحكمات الدقيقة على مستشعرات مدمجة. ولدى العديد منها خيارات لتوصيل المستشعرات بها.
كل من المتحكمات الدقيقة الثلاثة الموصى بها أدناه لها ميزاتها الخاصة، وقد تتطلب استخدام لغات برمجة مختلفة لجعلها تعمل لمشروعك. تحتوي بعض الأدوات، مثل App Inventor، على امتدادات يمكنك إضافتها لتتمكن من استخدام هذه الأجهزة مع تلك الأدوات. لقد أضافت جميع الأجهزة الثلاثة مؤخرًا إمكانية الذكاء الاصطناعي، لذا عليك أن تتحقق مما هو ممكن!
المزيد عن المستشعرات
هناك العديد من المستشعرات منخفضة التكلفة التي يمكن توصيلها بوحدات تحكم صغيرة وتزويد مشروعك بالبيانات. فيما يلي بعض المستشعرات التي يمكن استخدامها.

كاميرا

عداد السرعة

ميكروفون

مستشعر الضوء

مستشعر الضغط

مستشعر جودة الهواء

ميزان حرارة بالأشعة تحت الحمراء

مستشعر القرب
النشاط: تخطيط مجموعة البيانات الخاصة بك
اتبع الإرشادات الواردة في ورقة العمل لوضع الخطوط العريضة:
- ما هي البيانات التي تريد جمعها.
- أين ستجمع البيانات لمجموعة البيانات الخاصة بك. هل ستكون من المجتمع أو أجهزة الاستشعار أو مجموعات البيانات العامة؟
- كيف ستجمع البيانات؟ ماذا ستكون الفئات أو التسميات لنموذجك؟
- كم عدد الأمثلة لكل فصل؟ يجب أن يكون 50 لكل فصل كحد أدنى.
نصيحة الموجه
أفضل الممارسات أفضل الممارسات: شجع الطلاب على التفكير في المشاكل التي يواجهونها في حياتهم اليومية، هل هناك مجموعة بيانات تتعلق بذلك؟ هل هناك أي مستشعرات في الأشياء من حولك؟ ما نوع المعلومات التي تجمعها هذه المستشعرات؟ كيف يمكنك استخدامها (هاتف جوجل الجديد يحتوي على مستشعر درجة الحرارة)؟
أسئلة إرشادية لطرحها على الطلاب هل لدى مدينتك بوابة "البيانات المفتوحة"؟ مثال: مدينة نيويورك و إدمونتون، كندا.
يتم توفير نصائح الموجهين من خلال الدعم المقدم من AmeriCorps.

الانعكاس
لديك الآن خطة لمجموعة بياناتك! عندما تبدأ في جمع الأمثلة الخاصة بمجموعة البيانات الخاصة بك، حافظ عليها آمنة ومنظمة بشكل جيد.
لا تنسَ الاحتفاظ بجزء من مجموعة البيانات للاختبار! يجب الاحتفاظ بحوالي 10-20% منها منفصلة للاختبار.

مراجعة المصطلحات الرئيسية
مجموعات البيانات - مجموعات كبيرة من البيانات التي تُستخدم لتعليم الذكاء الاصطناعي التعرف على الأنماط والتنبؤ بشيء ما
جهاز استشعار - جهاز يكتشف التغيرات في البيئة ويستخدم لمراقبة تلك المعلومات داخل نظام إلكتروني
متحكم دقيق - كمبيوتر صغير على شريحة واحدة متكاملة، يستخدم في أجهزة الكمبيوتر الكبيرة والأنظمة الأخرى مثل الأجهزة والمركبات والروبوتات
الموارد الإضافية
الأجهزة والمستشعرات
للاطلاع على قائمة شاملة لأجهزة الاستشعار، راجع هذا مقالة ويكيبيديا.
يقدم هذا الفيديو معلومات جيدة عن أجهزة المتحكم الدقيق التي نوصي بها للمشاريع التي تستخدم المستشعرات.
يوضح لك هذا الفيديو التعليمي كيفية الوصول إلى مجموعة بيانات عامة على Kaggle.