تُعد البيانات العنصر الرئيسي لأي بحث أو دراسة أو مبادرة أعمال؛ لأنها تعتبر المادة الخام لما تنتجه من معلومات ومعرفة ورؤية وتفسير تساعد في فهم الظواهر واتخاذ القرارات.
وتعتبر البيانات ضمن أغلى وأثمن أصول أي مؤسسة؛ فبالتالي يتم التعامل معها بأهمية بالغة، وحتى يتم الحصول على المعلومات لا بد من اخضاع البيانات لعمليات من التحليل، وتحويلها من مادة خام إلى مواد يمكن التعامل معها وفهمها.
تعريف تحليل البيانات
تحليل البيانات هو عملية تطبيق الأساليب والاختبارات الإحصائية بشكل منهجي لوصف البيانات وتوضيحها وتكثيفها وتلخيصها وتقييمها.
وإن الإجراءات التحليلية المختلفة توفر طريقة لاستخلاص استنتاجات استقرائية من البيانات، وتمييز الإشارة (الظاهرة محل الدراسة) عن صدفة (التقلبات الإحصائية) الموجودة في البيانات".
في حين أن تحليل البيانات في البحث النوعي يمكن أن يشمل إجراءات إحصائية، إلا أن التحليل يصبح في كثير من الأحيان عملية تكرارية مستمرة حيث يتم جمع البيانات بشكل مستمر وتحليلها في وقت واحد تقريبًا.
وعندما يقوم الباحثون بتحليل الأنماط في الملاحظات خلال مرحلة جمع البيانات بأكملها. يتم تحديد شكل التحليل من خلال النهج النوعي المحدد المتبع (الدراسة الميدانية، تحليل محتوى، التاريخ الشفهي، السيرة الذاتية، البحث الإجرائي، والبحث شبه التجريبي) وشكل البيانات (الملاحظات الميدانية، الوثائق، الشريط الصوتي، شريط الفيديو، استيانات، اختبارات).
أحد العناصر الأساسية لضمان سلامة البيانات هو التحليل الدقيق والمناسب لنتائج البحوث، وإن التحليلات الإحصائية غير الصحيحة تشوه النتائج العلمية، وتضلل القراء العاديين ، وقد تؤثر سلبًا على التصور العام للبحث.
الاعتبارات المتعلقة في تحليل البيانات
هناك عدد من الاعتبارات التي يجب على الباحثين معرفتها فيما يتعلق بتحليل البيانات، وتشمل هذه:
امتلاك المهارات اللازمة للتحليل
الافتراض الضمني للباحثين هو أنهم تلقوا تدريبًا كافيًا لإثبات مستوى عالٍ من ممارسة البحث، من المحتمل أن يكون "سوء السلوك العلمي" غير المقصود نتيجة لسوء التدريس والمتابعة، يشير عدد من الدراسات إلى أن هذا قد يكون هو الحال في كثير من الأحيان أكثر مما كان يعتقد.
ومن الممارسات الشائعة للباحثين تأجيل اختيار الإجراء التحليلي إلى فريق البحث "الإحصائي"، ومن الناحية المثالية يجب أن يكون لدى الباحثين ما هو أكثر بكثير من الفهم الأساسي للأساس المنطقي لاختيار طريقة تحليل واحدة على أخرى. وهذا يمكن أن يسمح بالإشراف بشكل أفضل على الذين يقومون بعملية تحليل البيانات واتخاذ قرارات مستنيرة
اختيار طرق جمع البيانات والتحليل المناسب بشكل متزامن
أن طرق التحليل قد تختلف باختلاف التخصص العلمي، فإن المرحلة المثالية لتحديد الإجراءات التحليلية المناسبة تحدث في وقت مبكر من عملية البحث ولا ينبغي أن تكون فكرة لاحقة.
وينبغي الحصول على المشورة الإحصائية في مرحلة التخطيط الأولي للتحقيق، بحيث تكون، على سبيل المثال، طريقة أخذ العينات وتصميم الأداة مناسبة لجمع البيانات.
رسم استنتاج غير متحيز
الهدف الرئيسي من التحليل هو التمييز بين حدث يقع إما على أنه يعكس تأثيرًا حقيقيًا مقابل تأثيرًا خاطئًا. أي تحيز يحدث في جمع البيانات، أو اختيار طريقة التحليل، سيزيد من احتمالية استخلاص استنتاجات متحيزة.
ويمكن أن يحدث التحيز عندما يقل عدد المشاركين في الدراسة عن الحد الأدنى المطلوب لإثبات القوة الإحصائية أو الفشل في الحفاظ على فترة متابعة كافية مطلوبة لإثبات التأثير.
تحليل مجموعة فرعية غير مناسب
عند الفشل في إظهار مستويات مختلفة إحصائيًا بين مجموعات التحليل، قد يلجأ الباحثون إلى تقسيم التحليل إلى مجموعات فرعية أصغر وأصغر من أجل العثور على فرق.
وعلى الرغم من أن هذه الممارسة قد لا تكون غير أخلاقية بطبيعتها، إلا أنه ينبغي اقتراح هذه التحليلات قبل بدء الدراسة حتى لو كان القصد استكشافيًا بطبيعته. إذا كانت الدراسة استكشافية بطبيعتها، فيجب على الباحث توضيح ذلك حتى يفهم القراء أن البحث هو أكثر من مجرد رحلة صيد وليس مدفوعًا بالنظرية في المقام الأول.
وعلى الرغم من أن الباحث قد لا يكون لديه فرضية قائمة على النظرية لاختبار العلاقات بين المتغيرات التي لم يتم اختبارها سابقًا، إلا أنه يجب تطوير نظرية لشرح نتيجة غير متوقعة. في الواقع، في العلوم الاستكشافية، لا توجد فرضيات قبلية.
وبالتالي لا توجد اختبارات افتراضية. على الرغم من أن النظريات يمكن أن تقود في كثير من الأحيان العمليات المستخدمة في التحقيق في الدراسات النوعية، إلا أن أنماط السلوك أو الأحداث المستمدة من البيانات التي تم تحليلها يمكن أن تؤدي في كثير من الأحيان إلى تطوير أطر نظرية جديدة بدلاً من تحديدها مسبقًا.
ومن المتوقع أن الاختبارات الإحصائية المتعددة يمكن أن تسفر عن نتيجة مهمة عن طريق الصدفة وحدها بدلاً من أن تعكس تأثيرًا حقيقيًا.
وتتعرض النزاهة للخطر إذا أبلغ المحلل فقط عن الاختبارات ذات النتائج المهمة، وأهمل ذكر عدد كبير من الاختبارات التي فشلت في الوصول إلى الأهمية. وفي حين أن الوصول إلى الحزم الإحصائية الحاسوبية يمكن أن يسهل تطبيق إجراءات تحليلية متزايدة التعقيد، فإن الاستخدام غير المناسب لهذه الحزم يمكن أن يؤدي إلى انتهاكات أيضا.
اتباع معايير مقبولة للتخصصات
لقد طور كل مجال من مجالات الدراسة ممارساته المقبولة لتحليل البيانات، من الحكمة أن يتبع المحللون هذه المعايير المقبولة. ويذكر أن المعايير مبنية على عاملين:
- طبيعة المتغيرات المستخدمة (أي الكمية أو المقارنة أو النوعية).
- افتراضات حول المجتمع الذي يتم استخلاص البيانات منه (أي التوزيع العشوائي، والاستقلال، وحجم العينة، وما إلى ذلك). إذا استخدم المرء معايير غير تقليدية، فمن الأهمية بمكان أن يذكر بوضوح أنه يتم ذلك، وأن يوضح كيف يتم استخدام طريقة التحليل الجديدة وربما غير المقبولة، وكذلك كيف تختلف عن الطرق التقليدية الأخرى. على سبيل المثال:
إذا استخدم الباحث معايير غير تقليدية، فمن الأهمية بمكان أن يذكر بوضوح أنه يتم ذلك، وأن يوضح كيف يتم استخدام طريقة التحليل الجديدة وربما غير المقبولة، وكذلك كيف تختلف عن الطرق التقليدية الأخرى.
تحديد الأهمية
أن الممارسة التقليدية تهدف إلى وضع معيار لقبول الأهمية الإحصائية، مع بعض التخصصات، فقد يكون من المناسب أيضًا مناقشة ما إذا كان تحقيق الأهمية الإحصائية له معنى عملي حقيقي.
عدم وجود قياسات نتائج محددة وموضوعية بوضوح
لن يؤدي أي قدر من التحليل الإحصائي، بغض النظر عن مستوى التطور إلى تصحيح قياسات النتائج الموضوعية غير المحددة.
وسواء تم ذلك عن غير قصد أو عن قصد، فإن هذه الممارسة تزيد من احتمالية التشويش على تفسير النتائج، وبالتالي احتمال تضليل القراء.
تقديم تحليل صادق ودقيق
أساس هذه المشكلة هو الحاجة الملحة لتقليل احتمالية الخطأ الإحصائي، وتشمل التحديات الشائعة استبعاد القيم المتطرفة، وملء البيانات المفقودة، وتغيير البيانات أو تغييرها بطريقة أخرى، واستخراج البيانات، وتطوير تمثيلات رسومية للبيانات.
طريقة تقديم البيانات
ف ي بعض الأحيان قد يعزز الباحثون الانطباع بوجود نتيجة مهمة من خلال تحديد كيفية تقديم البيانات المشتقة (على عكس البيانات في شكلها الأولي)، وأي جزء من البيانات يتم عرضه ولماذا؟، وكيف؟، ولمن؟.
ويشارإلى أنه حتى الخبراء لا يتفقون على التمييز بين تحليل البيانات وقراءتها، ويجب على المحللين أن يحتفظوا بسجل ورقي كافٍ ودقيق لكيفية معالجة البيانات للمراجعة المستقبلية.
القضايا البيئية أوالمجتمعية
يمكن أن تتعرض سلامة تحليل البيانات للخطر بسبب البيئة أوالمجتمع الذي تم فيه جمع البيانات، أي المقابلات وجهاً لوجه مقابل المجموعة المركزة.
ويختلف التفاعل الذي يحدث ضمن علاقة ثنائية (الشخص الذي يجري المقابلة معه) عن ديناميكية المجموعة التي تحدث داخل مجموعة التركيز بسبب عدد المشاركين وكيفية تفاعلهم مع استجابات بعضهم البعض.
وبما أن عملية جمع البيانات يمكن أن تتأثر بالبيئة أوالمجتمع ، فيجب على الباحثين أخذ ذلك في الاعتبار عند إجراء تحليل البيانات.
طريقة تسجيل البيانات
ويمكن أن تتأثر التحليلات أيضًا بالطريقة التي تم بها تسجيل البيانات، وعلى سبيل المثال يمكن توثيق أحداث البحث من خلال:
- تسجيل الصوت و/أو الفيديو والنسخ لاحقًا
- إما باحثًا أو مسحًا ذاتيًا
- إما مسح مغلق أو مسح مفتوح
- إعداد ملاحظات ميدانية مسحية من مشارك/مراقب
- مطالبة المشاركين أنفسهم بتدوين الملاحظات وتجميعها وتقديمها إلى الباحثين.
في حين أن كل منهجية مستخدمة لها مبرراتها ومزاياها، فقد تثار قضايا الموضوعية والذاتية عند تحليل البيانات.
تقسيم النص
أثناء تحليل المحتوى، قد يستخدم الباحثون العاملون أو المحللون استراتيجيات غير متسقة في تحليل المواد النصية.
فقد يقوم بعض المحللين بتحليل التعليقات ككل بينما قد يفضل البعض الآخر تحليل المواد النصية عن طريق فصل الكلمات أو العبارات أو الجمل أو الجمل أو مجموعات الجمل. وينبغي بذل كل جهد ممكن لتقليل أو إزالة التناقضات بين المحللين حتى لا يتم المساس بسلامة البيانات.
تدريب المحللون
يمكن أن يحدث تحدي كبير لسلامة البيانات مع الإشراف غير الخاضع للرقابة على التقنيات الاستقرائية. يتطلب تحليل المحتوى من المحللين تعيين موضوعات للمواد النصية (التعليقات).
وقد ينشأ التهديد للنزاهة عندما يتلقى المحللون تدريبًا غير متسق، أو ربما تلقوا خبرة (تجارب) تدريبية سابقة. قد تؤثر الخبرة السابقة على كيفية إدراك المحللين للمادة أو حتى إدراكهم لطبيعة التحليلات التي سيتم إجراؤها.
وبالتالي يمكن لأحد المقيمين تعيين موضوعات أو رموز لمواد تختلف بشكل كبير عن مقيم آخر، وتشمل استراتيجيات معالجة هذا الأمر الإشارة بوضوح إلى قائمة إجراءات التحليلات في دليل البروتوكول، والتدريب المتسق، والرصد الروتيني للمحللين.
الصدق والثبات
يجب أن يكون الباحثون الذين يقومون بالتحليل على التحليلات الكمية أو النوعية على دراية بالتحديات التي تواجه الصدق والثبات (الخصائص السيكومترية لأدوات البحث).
فعلى سبيل المثال في مجال تحليل المحتوى، توجد ثلاثة عوامل يمكن أن تؤثر على ثبات البيانات التي تم تحليلها:
- الاستقرار، أو ميل المحللين إلى إعادة ترميز نفس البيانات باستمرار بنفس الطريقة على مدى فترة من الزمن.
- قابلية التكرار، أو ميل مجموعة من المحللين إلى تصنيف عضوية الفئات بنفس الطريقة.
- الدقة، أو مدى توافق تصنيف النص مع معيار أو قاعدة إحصائيا.
- تنشأ احتمالية المساس بسلامة البيانات عندما لا يتمكن الباحثون باستمرار من إثبات استقرار تحليل البيانات أو إمكانية تكرار نتائجه أو دقته
وبالتالي فإن صلاحية دراسة تحليل المحتوى تشير إلى توافق الفئات (التصنيف الذي يخصصه المحللون لمحتوى النص) مع الاستنتاجات، وقابلية تعميم النتائج على النظرية (هل دعمت الفئات النظرية) استنتاج الدراسة، وهل كانت النتيجة قوية بما يكفي لدعم أو تطبيقها على مبررات نظرية مختارة؟.
مدى التحليل
عند ترميز المواد النصية لتحليل المحتوى، يجب على المحللين تصنيف كل رمز في فئة مناسبة، بالاعتماد على برامج الحاسوب لتحديد التكرارات أو عدد الكلمات يمكن أن يؤدي إلى عدم الدقة.
وقد يحصل الباحث على إحصاء دقيق لحدوث تلك الكلمة وتكرارها، ولكن ليس لديه حساب دقيق للمعنى المتأصل في كل استخدام معين، و قد يكون من المناسب إجراء مزيد من التحليلات لاكتشاف أبعاد مجموعة البيانات أو تحديد المتغيرات الأساسية الجديدة ذات المعنى.
وسواء تم استخدام طرق التحليل الإحصائية أو غير الإحصائية، يجب أن يكون الباحثون على دراية بإمكانية المساس بسلامة البيانات.
في حين يتم إجراء التحليل الإحصائي عادةً على البيانات الكمية، إلا أن هناك العديد من الإجراءات التحليلية المصممة خصيصًا للمواد النوعية بما في ذلك المحتوى والتحليل الموضوعي والوثائقي.
وبغض النظر عما إذا كان الشخص يدرس الظواهر الكمية أو النوعية، يستخدم الباحثون مجموعة متنوعة من الأدوات لتحليل البيانات من أجل اختبار الفرضيات، وتمييز أنماط السلوك، والإجابة في نهاية المطاف على أسئلة البحث.
وقد يؤدي الفشل في فهم مشكلات تحليل البيانات المقدمة أو الاعتراف بها إلى الإضرار بسلامة البيانات.
ملاحظة: المقال مترجم، رابط المقال الأصلي.