Page 6 - الاصدار الخامس IT مجلة طموح
P. 6

‫التعليم‬
                                               ‫التنقيب في البيانات «‪»Data mining‬‬

                                                                  ‫فــي أيامنــا هــذه تفــرض ظــروف الحيــاة العمليــة علينــا أن نواجــه كميــات هائلــة‬
                                                                  ‫مـن البيانـات‪ ,‬وفـي ضـوء هـذا النمـو المتسـارع للبيانـات بتنـا أمـام ظاهـرة أشـبه‬

                                                                            ‫بالانفجــار الكبيــر إلا أنهــا انفجــار مــن نــوع آخــر يدعــى «انفجــار البيانــات»‪.‬‬
                                                                  ‫فــي ظــل هــذا الكــم الهائــل مــن البيانــات ظهــرت الحاجــة إلــى وجــود آليــة معينــة‬
                                                                  ‫نسـتطيع مـن خلالهـا التعامـل مـع هـذه البيانـات الضخمـة‪ .‬ومـن هنـا نشـأ مفهـوم‬
                                                                  ‫التنقيــب عــن البيانــات (المعلومــات) «‪ »Data Mining‬ليكــون الغواصــة التــي‬
‫نستكش ـف م ـن خلاله ـا أعم ـاق بح ـر البيان ـات الكبي ـر‪ ,‬إذاً ف ـي أيامن ـا ه ـذه تف ـرض ظ ـروف الحي ـاة العملي ـة علين ـا أن نواج ـه كمي ـات هائل ـة م ـن‬

                                                                                                                     ‫البيانــات‪ .‬إذاً مــا هــي ال ‪Data Mining‬‬
                                                                                                              ‫ما هو ال «‪ »Data Mining‬تنقيب البيانات‬
 ‫هي مجموعة من التقنيات المستخدمة من أجل اكتشاف نماذج من البيانات (معارف مفيدة) في قاعدة بيانات ضخمة وذلك بفعالية وكفاءة‬
      ‫عالية‪ .‬أو هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة‪.‬كما ويعرف‬
  ‫التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة) لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة‬
        ‫تكون مفهومة ومفيدة لصاحب البيانات‪ .‬يطلق اسم «نماذج» ‪ models‬على العلاقات والبيانات الملخصة التي يتم الحصول عليها من‬
‫التنقيب في البيانات‪ .‬يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثل ًا قاعدة‬
                       ‫بيانات التعاملات في مصرف ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلق ًا على طريقة تجميع البيانات ذاتها‪.‬‬
‫عنـد التعامـل مـع حجـم كبيـر مـن البيانـات تظهـر مسـائل جديـدة مثـل كيفيـة تحديـد النقـاط المميـزة فـي البيانـات‪ ،‬وكيفيـة تحليـل البيانـات‬
‫فـي فتـرة زمنيـة معقولـة وكيفيـة قـرار مـا إذا كانـت أي علاقـة ظاهريـة تعكـس حقيقـة فـي طبيعـة البيانـات‪ .‬عـادة يتـم التنقيـب فـي بيانـات‬
‫تكـون جـزءاً مـن كامـل البيانـات حيـث يكـون الغـرض عـادة تعميـم النتائـج علـى كامـل البيانـات (مثـ ًا تحليـل البيانـات الحاليـة لمسـتهلكي‬
                                                                                        ‫منتـج مـا بغـرض توقـع طلبـات المسـتهلكين المسـتقبلية)‪.‬‬
                                                         ‫أنواع الـ «‪ »Data Mining‬تنقيب البيانات‬
                                                 ‫هناك نوعان أساسيان للتنقيب في البيانات هما‪:‬‬
‫‪ .1‬التنقيـب الاستشـرافي ينتـج عنـه نمـوذج عـن النظـام الـذي تصفـه البيانـات المسـتخدمة‬
                                                                                        ‫فـي التنقيـب‪.‬‬
‫‪ .2‬التنقيـب الوصفـي فينتـج عنـه معلومـات جديـدة بنـاء علـى المعلومـات الموجـودة داخـل‬
                                                     ‫البيانـات المسـتخدمة فـي عمليـة التنقيـب‪.‬‬
                                                     ‫أهداف ال «‪ »Data Mining‬تنقيب البيانات‪:‬‬
                                                           ‫هناك ثلاثة أهداف للتنقيب في البيانات‪:‬‬
‫‪ .1‬مـن اجـل إختـزال كميـة البيانـات الكبيـرة أو ضغطهـا بحيـث تع ّبـر بشـكل بسـيط عـن كامـل‬
                                                                             ‫البيانـات بـدون تعميـم‪.‬‬
                                                         ‫‪ .2‬من أجل تعليل بعض الظواهر المرئية‪.‬‬
‫‪ .3‬مـن أجـل التثبـت مـن نظريـ ٍة مـا مثـل التثبـت مـن النظريـة التـي تقـول بـأن الأسـر الكبيـرة‬
                                          ‫تهتـم بالضمـان الصحـي أكثـر مـن الأسـر الأصغـر عـدداً‪.‬‬
                        ‫‪ .4‬من أجل تحليل البيانات للحصول على علاقات جديدة وغير متوقعة‪.‬‬
                                                                                    ‫طبيعة نماذج البيانات التي تسعى الـ «‪ »Data mining‬لإكتشافها‬

                                                                                                                                     ‫تتصف البيانات بالآتي ‪:‬‬
                                                                                                                                           ‫‪ .1‬صالحة (‪)Valid‬‬

                                                                                                                                         ‫‪ .2‬مفيدة (‪)Useful‬‬
                                                                                                                           ‫‪ .3‬مفهومة (‪)Understandable‬‬
                                                                                                                        ‫‪ .4‬مبتكرة أو غير مألوفة (‪)Novel‬‬
 ‫إذاً وبالرغم من وجود البيانات بصورة ضخمة ومبعثرة وعشوائية أحيان ًا تستطيع الـ ‪ Data Mining‬تحليل هذه البيانات (الخام) وفق خوارزميات‬
                                                                                                      ‫محددة لإستخراج المعارف والمعلومات المفيدة ‪.‬‬

                                                                                                                 ‫‪6‬‬
   1   2   3   4   5   6   7   8   9   10   11