خريطة الطريق إلى تعلم الآلة
كاتب المقال: محمد الحامد ترجمة: محمد الحامد
[ رابط المقال الأصلي هنا ]
بادئ ذي بدء، أنت على الطريق الصحيح. يعد العمل على تعلم الآلة (Machine Learning) من أجل بناء معرفتك في مجال الذكاء الاصطناعي خياراً مميزاً. تحرز تقنيات الذكاء الاصطناعي تقدماً هائلاً ليس فقط في تطوير البرمجيات بل كل جانب من جوانب حياتنا اليومية.
لا يجب أن لتكون عظيماً لتبدأ، لكن يجب أن تبدأ لتكون عظيماً – ZIG ZIGLAR
التقدم في الذكاء الاصطناعى
الذكاء الاصطناعى يتطور بسرعة، ومن الضروري أن تتعلم هذه التقنيات. ابدأ بفهم المصطلحات وما الذي يمكن وما لا يمكن عمله وما هي فوائد استخدام خوارزميات تعلم الآلة المختلفة.
تستكشف العديد من المؤسسات والشركات استخدام الذكاء الاصطناعي في محاولات لتعزيز الأداء أو مساعدتها في بناء قيمة للبيانات الموجودة بها.
تعلم الآلة ممتع
على الرغم من أن المصطلحات التي تحيط بهذا الموضوع تبدو معقدة، إلا أنه الحقيقة ليست كذلك. إنها أبسط بكثير اليوم من أي وقت مضى!
في بضع خطوات بسيطة، يمكنك تحميل بياناتك وتحليل الارتباطات وتحديد الهدف الذي تريد التنبؤ به. ومن ثم تصميم وتطوير الخوارزمية المناسبة لحل المشكلة. بالتأكيد أن الرحلة ممتعة للغاية. ضبط الخوارزمية والعمل على تحسين النتائج يستحق كل هذا العناء.
ما يثير دهشتي حول تعلم الآلة والذكاء الاصطناعي التمكن من استخدامها في مجالات متعددة منها ورؤية الحاسب (مثال التعرف على خط اليد) واللغويات (مثال الترجمة) والتمويل (مثال اكتشاف الاحتيال) وغيرها. مع وجود خوارزميات مفتوحة المصدر و متاحة لك، كل ما تحتاجه هو “clone”.
لغات البرمجة؟
يستخدم العديد من علماء البيانات لغة بايثون في مشاريعهم. سوف تجد الغالبية العظمى من كتب تعلم الآلة والدورات المتوفرة عبر الإنترنت تدرس تعلم الآلة بلغة بايثون. أيضًا، هناك دعم متزايد للشفرات مفتوحة المصدر مكتوبة ببايثون، والتي ستمكنك من تسارع عجلة التعلم لديك بشكل ملحوظ في البداية. هنا مقالة رائعة تقارن تطور اللغات المختلفة المستخدمة في تعلم الآلة.
إذا كنت قادمًا من خلفية هندسة البرمجيات، فأنت لست وحدك! نحن نتفهم دورة حياة تطوير البرمجيات (SDLC)، كما أن عقولنا أقرب لفهم عملية التطوير في شكل خطوات مستمرة. تختلف برمجة نماذج تعلم الآلة قليلاً، يتم بذل معظم الجهد في هندسة المميزات والنمذجة فور توفر البيانات بشكل مقبول. تصف العديد من الأطر تطور دورة حياة نماذج تعلم الآلة. هنا وجهة نظري تجاه ذلك.
الكتب
كتب عن تعلم الآلة
- العنوان: “مائة صفحة في تعلم الآلة”
- العنوان “التدريب العملي على تعلم الآلة باستخدام Scikit-Learn & TensorFlow”
- العنوان “التعلم الآلي للأغبياء”. المقدم مجاناً من قبل شركة IBM
كتب في الإحصاء
- العنوان: “عناصر التعلم الإحصائي”
- العنوان “الرغبة المحركة في الاحصاء”.هذا الكتاب هو مرجع مفيد لتنفيذ وظائف إحصائية مختلفة، مثل “اختبار مربع تشي”. ويوضح كيف يمكن تنفيذ هذه الوظائف في لغات مختلفة، بما في ذلك بايثون.
الدورات
هنا سأسلط الضوء على اختيار الدورات التي أعتقد أنها تحتوي على موارد عالية الجودة.
تعلم لغة بايثون
- العنوان: “مقدمة لبايثون لعلوم البيانات” مقدمة من DataCamp
- العنوان: “علوم البيانات التطبيقية مع بايثون” على منصة كورسيرا
دورات تعلم الآلة
- العنوان: “تعلم الآلة” المقدم من جامعة ستانفورد على منصة كورسيرا.
- العنوان: “التخصص في التعلم العميق” مجموعة من 5 دورات على منصة كورسيرا
- العنوان: “شهادة الاحترافية في علم البيانات من شركة IBM.” مجموعة من 9 دورات على منصة كورسيرا
- العنوان: “دورة تعلم الآلة المفتوحة”
- مجموعة من الدورات المجانية التي تقدمها “Fast.ai”
مكان للممارسة
“أنا لا أزال أتعلم.” -MICHELANGELO
أخذ دورة تدريبية عبر الإنترنت أمر رائع، ولكن أليس من الأفضل تعلم شيء ما من خلال المشاركة في مشروع حقيقي؟ هنا هو المكان الذي يجب أن تفكر فيه:
- Kaggle هو مجتمع عبر الإنترنت لعلماء البيانات. استحوذت عليه شركة جوجل في عام 2017. يعد من الأماكن المفضلة لتعلم المشكلات الحقيقية والعثور على حلول مميزة. يمكنك العثور على العديد من مجموعات البيانات المفيدة لممارسة وبناء النماذج والتنافس مع بعض مع أفضل علماء البيانات حول العالم.
قواعد البيانات
البيانات طالما وصفت بالذهب، وإيجاد مجموعة بيانات عالية الجودة لتجربتك الدراسية يمثل تحديًا كبيرًا. فيما يلي بعض الأماكن الرائعة التي يجب البحث فيها:
- Kaggle: مجتمع عبر الإنترنت لعلماء البيانات من قِبل جوجل.
- Google Dataset Search يشبه كثيراً منصة البحث عن الأوراق البحثية ويستخدم للبحث عن البيانات والبيانات المستخدمة في بعض المقالات العلمية المنشورة.
- مجموعات بيانات أمازون: يمكنك العثور على العديد من مجموعات البيانات على منصة Amazon AWS.
- البيانات المفتوحة من أبحاث ميكروسوفت: توفر شركة ميكروسوفت العديد من مجموعات البيانات جنبًا إلى جنب مع بعض البيانات الأخرى المستضافة على منصتها.
- OpenML: عبارة عن منصة عبر الإنترنت لمشاركة البيانات والنماذج والخوارزميات.
- Visualdata: مصدر لا يقدر بثمن للتجارب المتعلقة برؤية الحاسب.
- PapersWithCode: منصة للعثور على المقالات مع التعليمات البرمجية ومجموعات البيانات المستخدمة في البحث.
الدروس المستفادة
هناك مجموعة واسعة من الموارد عبر الإنترنت لتعلم “تعلم الآلة”. أفضل شيء قمت به هو إتقان لغة بايثون أثناء تعلم “النظريات حول تعلم الآلة” ومحاولة فهم خوارزميات تعلم الآلة المختلفة. بمجرد أن فعلت ذلك، انتقلت إلى بناء وتدريب نماذج مختلفة. يعد الانخراط في مشاريع حقيقية هو الأفضل لتسريع منحنى التعلم لديك، خاصة على منصة Kaggle. كنت أركز أكثر في البداية على المشاريع التي لا تتطلب جمع اضافي للبيانات أو تلك التي تتطلب تنظيفًا مكثفًا أو المعالجة المسبقة. وقد ساعدني ذلك في التركيز على بناء النموذج، مثل اختيار النموذج المناسب وضبط معاملات النموذج.
التركيز على تحسين أداء نموذج أمر جيد و أساسي. لكن تجربة نشر النموذج ستجعل التصميم الهندسي للنموذج أكثر واقعية. بعض النماذج الدقيقة التي تهدف إلى أتمتة بعض العمليات التجارية غير مجدية إذا لم نتمكن من وضعها في البيئة التشغيلية.
ملاحظة أخيرة
في بداية رحلة التعلم الخاصة بك، يمكن أن تشعر أن وجود العديد من الصناديق السوداء حول نماذج تعلم الآلة المختلفة التي تبدو أنها تعمل مثل السحر! قد تفشل في معرفة الأسباب التي تجعل نموذج ما لا يتنبأ بشكل صحيح. قد تجد أنه من المفيد البدء بعدد صغير من المميزات التي يمكنك استخدامها لتتبع النموذج وتصحيحه.