Page 6 - الاصدار الخامس IT مجلة طموح
P. 6
التعليم
التنقيب في البيانات «»Data mining
فــي أيامنــا هــذه تفــرض ظــروف الحيــاة العمليــة علينــا أن نواجــه كميــات هائلــة
مـن البيانـات ,وفـي ضـوء هـذا النمـو المتسـارع للبيانـات بتنـا أمـام ظاهـرة أشـبه
بالانفجــار الكبيــر إلا أنهــا انفجــار مــن نــوع آخــر يدعــى «انفجــار البيانــات».
فــي ظــل هــذا الكــم الهائــل مــن البيانــات ظهــرت الحاجــة إلــى وجــود آليــة معينــة
نسـتطيع مـن خلالهـا التعامـل مـع هـذه البيانـات الضخمـة .ومـن هنـا نشـأ مفهـوم
التنقيــب عــن البيانــات (المعلومــات) « »Data Miningليكــون الغواصــة التــي
نستكش ـف م ـن خلاله ـا أعم ـاق بح ـر البيان ـات الكبي ـر ,إذاً ف ـي أيامن ـا ه ـذه تف ـرض ظ ـروف الحي ـاة العملي ـة علين ـا أن نواج ـه كمي ـات هائل ـة م ـن
البيانــات .إذاً مــا هــي ال Data Mining
ما هو ال « »Data Miningتنقيب البيانات
هي مجموعة من التقنيات المستخدمة من أجل اكتشاف نماذج من البيانات (معارف مفيدة) في قاعدة بيانات ضخمة وذلك بفعالية وكفاءة
عالية .أو هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة.كما ويعرف
التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة) لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة
تكون مفهومة ومفيدة لصاحب البيانات .يطلق اسم «نماذج» modelsعلى العلاقات والبيانات الملخصة التي يتم الحصول عليها من
التنقيب في البيانات .يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثل ًا قاعدة
بيانات التعاملات في مصرف ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلق ًا على طريقة تجميع البيانات ذاتها.
عنـد التعامـل مـع حجـم كبيـر مـن البيانـات تظهـر مسـائل جديـدة مثـل كيفيـة تحديـد النقـاط المميـزة فـي البيانـات ،وكيفيـة تحليـل البيانـات
فـي فتـرة زمنيـة معقولـة وكيفيـة قـرار مـا إذا كانـت أي علاقـة ظاهريـة تعكـس حقيقـة فـي طبيعـة البيانـات .عـادة يتـم التنقيـب فـي بيانـات
تكـون جـزءاً مـن كامـل البيانـات حيـث يكـون الغـرض عـادة تعميـم النتائـج علـى كامـل البيانـات (مثـ ًا تحليـل البيانـات الحاليـة لمسـتهلكي
منتـج مـا بغـرض توقـع طلبـات المسـتهلكين المسـتقبلية).
أنواع الـ « »Data Miningتنقيب البيانات
هناك نوعان أساسيان للتنقيب في البيانات هما:
.1التنقيـب الاستشـرافي ينتـج عنـه نمـوذج عـن النظـام الـذي تصفـه البيانـات المسـتخدمة
فـي التنقيـب.
.2التنقيـب الوصفـي فينتـج عنـه معلومـات جديـدة بنـاء علـى المعلومـات الموجـودة داخـل
البيانـات المسـتخدمة فـي عمليـة التنقيـب.
أهداف ال « »Data Miningتنقيب البيانات:
هناك ثلاثة أهداف للتنقيب في البيانات:
.1مـن اجـل إختـزال كميـة البيانـات الكبيـرة أو ضغطهـا بحيـث تع ّبـر بشـكل بسـيط عـن كامـل
البيانـات بـدون تعميـم.
.2من أجل تعليل بعض الظواهر المرئية.
.3مـن أجـل التثبـت مـن نظريـ ٍة مـا مثـل التثبـت مـن النظريـة التـي تقـول بـأن الأسـر الكبيـرة
تهتـم بالضمـان الصحـي أكثـر مـن الأسـر الأصغـر عـدداً.
.4من أجل تحليل البيانات للحصول على علاقات جديدة وغير متوقعة.
طبيعة نماذج البيانات التي تسعى الـ « »Data miningلإكتشافها
تتصف البيانات بالآتي :
.1صالحة ()Valid
.2مفيدة ()Useful
.3مفهومة ()Understandable
.4مبتكرة أو غير مألوفة ()Novel
إذاً وبالرغم من وجود البيانات بصورة ضخمة ومبعثرة وعشوائية أحيان ًا تستطيع الـ Data Miningتحليل هذه البيانات (الخام) وفق خوارزميات
محددة لإستخراج المعارف والمعلومات المفيدة .
6

