محلل البيانات الضخمة مع الإحصاءات

مجاناً لك مجاناً

من خلال الترويج

تبدأ الدورة بمعرفة الإحصاء وتمكنك من التعرف على الارتباطات والتحقق من الملاحظات وتصنيف بيانات القياس بشكل صحيح. كما ستتعرف أيضاً على مجالات تحليل البيانات وهندسة البيانات، واستخدام الذكاء الاصطناعي (AI) في هذا المجال وإدارة تحليل البيانات في البيانات الضخمة.
  • نوع الدرجة العلمية: شهادة "إحصائيات
    شهادة "محلل البيانات الضخمة"
  • المؤهلات الإضافية: شهادة "مهندس بيانات
    شهادة تحليل البيانات"
    شهادة "أخصائي البيانات الضخمة"
  • الامتحان النهائي: عمل مشروع عملي مع عروض تقديمية نهائية
  • أوقات الدرس: دوام كامل
    من الإثنين إلى الجمعة من الساعة 8:30 صباحًا إلى 3:35 مساءً (في الأسابيع التي تتخللها عطلات رسمية من الساعة 8:30 صباحًا إلى 5:10 مساءً)
  • لغة التعليم: الألمانية
  • المدة: 16 أسابيع

الإحصائيات

أساسيات الإحصاء (6 أيام تقريباً)

أساسيات نظرية القياس (المجتمع والعينة، أنواع العينات، مستويات القياس والمقياس)

الإحصاءات الوصفية أحادية المتغير (التوزيعات التكرارية والمقاييس المركزية ومقاييس التشتت والقيمة المعيارية والرسوم البيانية والمخططات البيانية الشريطية والمخططات الدائرية والمخططات الخطية والمخططات الصندوقية)

الإحصاءات الوصفية ثنائية المتغيرات (مقاييس الارتباط، ومعاملات الارتباط، والمخططات التبادلية والمخططات المبعثرة والمخططات الشريطية المجمعة)

أساسيات الإحصاء الاستدلالي الاستقرائي (التوزيع الاحتمالي، والتوزيع الطبيعي، والتوزيع الطبيعي ومتوسط توزيع القيمة، واختبار الدلالة، واختبار فرضية فيشر الفارغة، وحجم التأثير، وتقدير البارامترات، وفترات الثقة، ومخططات أشرطة الخطأ، وتحليلات القدرة، وتحديد حجم العينة الأمثل)


الذكاء الاصطناعي في إجراءات العمل

عرض تقنيات محددة للذكاء الاصطناعي

والتطبيقات الممكنة في البيئة المهنية


طرق المقارنة بين مجموعتين (5 أيام تقريبًا)

اختبار z- و t لعينة (الانحراف عن قيمة محددة)

اختبار t لمتوسط الفرق بين عينتين مستقلتين/مترابطتين

اختبار فعالية الإجراءات والتدابير والتدخلات وغيرها من التغييرات باستخدام اختبارات t (تصميمات ما قبل الاختبار بعد الاختبار مع مجموعتين)

اختبارات الدلالة الداعمة (اختبار أندرسون-دارلينغ، واختبار رايان-جوينر، واختبار ليفين، واختبار بونيت، واختبار الدلالة للارتباطات)

الطرق غير البارامترية (اختبار ويلكوكسون، اختبار الإشارة، اختبار مان-ويتني)

التحليلات الاحتمالية (اختبار ذات الحدين، اختبار فيشر الدقيق، اختبار تشي سكوير، التبويبات التبادلية مع مقاييس الارتباط)


طرق مقارنة وسائل عدة مجموعات (5 أيام تقريبًا)

تحليل التباين أحادي وثنائي العامل (تحليل التباين البسيط والمتوازن)

تحليل التباين متعدد العوامل (النموذج الخطي العام)

العوامل الثابتة والعشوائية والمتداخلة والمتداخلة

طرق المقارنة المتعددة (Tukey-HSD، Dunnett، Hsu-MCB، Games-Howell)

تحليل التفاعل (تحليل تأثيرات التفاعل)

تحليل الانتقائية والقوة لتحليلات التباين


مقدمة في تصميم التجارب (DoE) (يوم واحد تقريباً)

التصميمات التجريبية المضروبة الكاملة والجزئية


عمل المشروع (3 أيام تقريباً)

لتوحيد المحتوى الذي تم تعلمه

عرض نتائج المشروع

مهندس بيانات

أساسيات ذكاء الأعمال (يومان تقريباً)

مجالات التطبيق، وأبعاد بنية ذكاء الأعمال

أساسيات ذكاء الأعمال، OLAP، OLTP، مهام مهندسي البيانات

تخزين البيانات (DWH): معالجة ومعالجة البيانات المنظمة وشبه المنظمة وغير المنظمة


إدارة المتطلبات (يومان تقريباً)

المهام والأهداف والإجراءات في تحليل المتطلبات

نمذجة البيانات، مقدمة/النمذجة باستخدام إدارة المتطلبات ERM

مقدمة/نمذجة في UML

- مخططات الفئات

- تحليل حالة الاستخدام

- مخططات الأنشطة


الذكاء الاصطناعي في إجراءات العمل

عرض تقنيات محددة للذكاء الاصطناعي

والتطبيقات الممكنة في البيئة المهنية


قواعد البيانات (3 أيام تقريباً)

أساسيات أنظمة قواعد البيانات

بنية أنظمة إدارة قواعد البيانات

تطبيق أنظمة إدارة قواعد البيانات

تنفيذ نموذج البيانات في نظم إدارة قواعد البيانات RDBMS، النماذج العادية

مقدمة عملية ونظرية ل SQL

حدود قواعد البيانات العلائقية، csv، json


مستودع البيانات (حوالي 4 أيام)

مخطط النجمة

نمذجة البيانات

إنشاء مخطط نجمي في نظام إدارة البيانات الرقمي (RDBMS)

مخطط ندفة الثلج والأساسيات ونمذجة البيانات

إنشاء مخطط ندفة الثلج في RDBMS

مخطط المجرة: الأساسيات، نمذجة البيانات

جداول الأبعاد المتغيرة ببطء من النوع 1 إلى 5 - إعادة التجميع والتكديس وإعادة التنظيم والبعد المصغر والنوع 5

مقدمة في الأبعاد العادية والسببية والصغيرة والوحشية والمتغايرة والفرعية

مقارنة بين الحالة والموجهة نحو المعاملات

جداول حقائق DWH والكثافة والتخزين


ETL (حوالي 4 أيام)

تنظيف البيانات

- القيم الفارغة

- إعداد البيانات

- مواءمة البيانات

- تطبيق التعبيرات العادية

فهم البيانات

- التحقق من صحة البيانات

- تحليل البيانات الإحصائية

حماية البيانات وأمن البيانات

الهيكل العملي لمسارات ETL

مخزن البيانات 2.0، الأساسيات، والمحاور، والروابط، والأقمار الصناعية، ومفتاح التجزئة، وفرق التجزئة

نمذجة بيانات مخزن البيانات

الهيكل العملي لنموذج قبو البيانات - قبو البيانات الخام، التنفيذ العملي لإجراءات التجزئة


عمل المشروع (5 أيام تقريباً)

لتوحيد المحتوى المكتسب

عرض نتائج المشروع

تحليلات البيانات

مقدمة في تحليل البيانات (يوم واحد تقريباً)

النموذج المرجعي CRISP-DM

سير عمل تحليلات البيانات

تعريف الذكاء الاصطناعي والتعلم الآلي والتعلم العميق

المتطلبات ودور مهندسي البيانات وعلماء البيانات ومحللي البيانات في الشركة


مراجعة أساسيات بايثون (يوم واحد تقريبًا)

أنواع البيانات

الدوال


تحليل البيانات (3 أيام تقريبًا)

وحدات بايثون المركزية في سياق تحليل البيانات (NumPy، Pandas)

عملية إعداد البيانات

خوارزميات التنقيب عن البيانات في بايثون


الذكاء الاصطناعي في إجراءات العمل

عرض تقنيات محددة للذكاء الاصطناعي

والتطبيقات الممكنة في البيئة المهنية


تصور البيانات (3 أيام تقريباً)

تحليل البيانات الاستكشافية

الرؤى

جودة البيانات

تحليل الفوائد

التصور باستخدام Python: Matplotlib وSeaborn وPlotly Express

سرد قصص البيانات


إدارة البيانات (يومان تقريباً)

هياكل البيانات الضخمة

قواعد البيانات العلائقية مع SQL

المقارنة بين قواعد بيانات SQL وقواعد بيانات NoSQL

ذكاء الأعمال

حماية البيانات في سياق تحليل البيانات


تحليل البيانات في سياق البيانات الضخمة (يوم واحد تقريباً)

نهج MapReduce

سبارك

NoSQL


لوحات المعلومات (3 أيام تقريباً)

المكتبة: اندفاعة

هيكل لوحات المعلومات - مكونات لوحة المعلومات - مكونات لوحة المعلومات

تخصيص لوحات المعلومات

عمليات الاستدعاء


التنقيب في النصوص (يوم واحد تقريباً)

المعالجة المسبقة للبيانات

التصور

مكتبة: سباسي


عمل المشروع (5 أيام تقريباً)

لتوحيد المحتوى المكتسب

عرض نتائج المشروع

أخصائي البيانات الضخمة

ما هي البيانات الضخمة؟ (يوم واحد تقريباً)

الحجم، والسرعة، والتنوع، والقيمة، والصدقية

فرص ومخاطر الكميات الكبيرة من البيانات

التمايز: ذكاء الأعمال، تحليلات البيانات، علم البيانات

ما هو التنقيب في البيانات؟


مقدمة في أطر عمل أباتشي (يومان تقريباً)

حلول البيانات الضخمة في السحابة

أنماط الوصول إلى البيانات

تخزين البيانات


MapReduce (3 أيام تقريباً)

فلسفة MapReduce

مجموعة Hadoop العنقودية

تسلسل مهام MapReduce


الذكاء الاصطناعي في إجراءات العمل

عرض تقنيات محددة للذكاء الاصطناعي

والتطبيقات الممكنة في البيئة المهنية


المكونات (3 أيام تقريباً)

عرض موجز للأدوات المختلفة

نقل البيانات

تطبيقات YARN

واجهة برمجة تطبيقات Hadoop JAVA

أباتشي سبارك


NoSQL و HBase (3 أيام تقريباً)

نظرية كاب

ACID و BASE

أنواع قواعد البيانات

قاعدة HBase


تصورالبيانات الضخمة (3 أيام تقريباً)

نظريات التصور

اختيار الرسم البياني

أنواع جديدة من الرسوم البيانية

أدوات لتصور البيانات


عمل المشروع (5 أيام تقريباً)

لتوحيد المحتوى المكتسب

عرض نتائج المشروع



التغييرات ممكنة. يتم تحديث محتوى الدورة التدريبية بانتظام.

مهارات البرمجة (من الناحية المثالية Python) والخبرة في قواعد البيانات (SQL) مطلوبة.

لقد أتقنت العمليات التي ينطوي عليها دمج البيانات وإعدادها وإثرائها وإعادة توجيهها وفهم تحليلات البيانات الضخمة باستخدام مفاهيم برمجة Python الأساسية ومفاهيم قواعد بيانات SQL وNoSQL. معرفة البرامج الخاصة بالصناعة لمعالجة وهيكلة البيانات الضخمة غير المهيكلة وتصورها يكمل معرفتك.

بعد هذه الدورة، ستفهم أساسيات الإحصاءات، وستكون قادراً على معالجة البيانات وتقييمها وتقديم وشرح وتفسير تحليلات ونتائج البيانات الإحصائية باستخدام الرسومات البيانية.

تستهدف الدورة التدريبية الأشخاص الحاصلين على شهادة في علوم الحاسب الآلي أو المعلوماتية التجارية أو إدارة الأعمال أو الرياضيات أو مؤهل مماثل.

يُعد التقييم المنهجي لأحجام البيانات أمرًا ضروريًا للشركات من أجل الحصول على معلومات حول منتجاتها وسلوك العملاء. وفي ظل هذه الخلفية، يتزايد الطلب على محللي البيانات الضخمة في جميع الصناعات.

تُعد المعرفة السليمة بالإحصاء مؤهلًا إضافيًا قيّمًا ومطلوبًا بشدة في مجال البحث والتطوير الصناعي، أو في تطوير الأدوية، أو في الإشراف على الدراسات الطبية، أو في مجال التمويل والتأمين، أو في تكنولوجيا المعلومات، أو في الإدارة العامة.

توفر لك شهادتك المفيدة نظرة تفصيلية عن المؤهلات التي اكتسبتها وتحسن من فرصك المهنية.

المفهوم التعليمي

إن محاضريك مؤهلون تأهيلاً عالياً من الناحيتين المهنية والتعليمية وسيقومون بتدريسكم من اليوم الأول إلى اليوم الأخير (لا يوجد نظام للدراسة الذاتية).

سوف تتعلم في مجموعات صغيرة فعالة. تتكون الدورات عادةً من 6 إلى 25 مشاركاً. تُستكمل الدروس العامة بالعديد من التمارين العملية في جميع وحدات الدورة التدريبية. تُعد مرحلة الممارسة جزءًا مهمًا من الدورة، حيث أنه خلال هذا الوقت تقوم بمعالجة ما تعلمته وتكتسب الثقة والروتين في تطبيقه. يتضمن القسم الأخير من الدورة التدريبية مشروعاً أو دراسة حالة أو امتحاناً نهائياً.

 

الفصول الدراسية الافتراضية alfaview®

Bildungszentrumتُقدَّم الدروس باستخدام تقنية الفيديو الحديثة alfaview® - إما من منزلك أو في مقرنا في . يمكن للدورة التدريبية بأكملها رؤية بعضكم البعض وجهاً لوجه عبر alfaview®، والتواصل مع بعضكم البعض بجودة صوت متزامنة الشفاه والعمل على مشاريع مشتركة. وبالطبع، يمكنك أيضاً رؤية مدربيك المتصلين والتحدث إليهم مباشرةً في أي وقت، وسيقوم المحاضرون بتدريسكم في الوقت الفعلي طوال مدة الدورة التدريبية. الدروس ليست تعليماً إلكترونياً، بل تدريس حقيقي مباشر وجهاً لوجه عبر تقنية الفيديو.

 

alfatraining Agentur für Arbeit الدورات التدريبية في مدعومة ومعتمدة وفقًا للائحة اعتماد AZAV. Bildungsgutschein Aktivierungs- und Vermittlungsgutscheinعند تقديم أو، عادةً ما يتم تغطية تكاليف الدورة التدريبية بالكامل من قبل جهة التمويل.
Europäischen Sozialfonds Deutsche Rentenversicherung يمكن التمويل أيضًا من خلال (ESF) أو (DRV) أو برامج التمويل الإقليمية. Berufsförderungsdienst كجندي منتظم، يمكن حضور المزيد من الدورات التدريبية عن طريق (BFD). Agentur für Arbeit (Qualifizierungschancengesetz) يمكن للشركات أيضًا تأهيل موظفيها عن طريق برنامج تمويل من .

يسعدنا تقديم المشورة لك مجاناً. 0800 3456-500 من الإثنين إلى الجمعة من الساعة 8 صباحًا إلى الساعة 5 مساءً
مجانًا من جميع الشبكات الألمانية.
اتصل بنا
يسعدنا تقديم المشورة لك مجاناً. 0800 3456-500 من الإثنين إلى الجمعة من الساعة 8 صباحًا حتى 5 مساءً مجانًا من جميع الشبكات الألمانية.