ما هو الفرق بين علوم البيانات Data Science والبيانات الضخمة Big Data

ثريد/ ما هو الفرق بين علوم البيانات Data Science والبيانات الضخمة Big Data
البيانات الكبيرة هي في الأساس تطبيق خاص لعلم البيانات ، حيث مجموعات البيانات هائلة وتتطلب التغلب على التحديات اللوجستية للتعامل معها. ويتمثل الشاغل الرئيسي في الحصول على المعلومات من مجموعات البيانات الهائلة هذه وتخزينها واستخراجها ومعالجتها وتحليلها بكفاءة.
وغالبا ما لا يكون تجهيز وتحليل مجموعات البيانات الضخمة هذه ممكنا أو قابلا للتحقيق بسبب القيود المادية و/أو الحسابية. لذا فإن التقنيات والأدوات الخاصة (مثل البرمجيات ، والخوارزميات ، والبرمجة الموازية ، وما إلى ذلك) مطلوبة.
Big Data هو المصطلح الذي يستخدم ليشمل مجموعات البيانات الكبيرة هذه ، والتقنيات المتخصصة ، والأدوات المكيفة. وكثيرا ما يطبق على مجموعات البيانات الكبيرة من أجل إجراء تحليل عام للبيانات وإيجاد اتجاهات ، أو لإنشاء نماذج تنبؤية.
ربما تتسائل لماذا مصطلح "بيج داتا" أصبح جديراً بالثرثرة. لقد جمعنا الكثير من البيانات من مختلف الأنواع على مجموعة كبيرة من آليات تخزين البيانات لفترة طويلة ، أليس كذلك ؟ نعم ، لكننا لم نستمتع من قبل بجمع البيانات الرخيصة ، وقدرات التخزين ، والطاقة الحسابية كما نفعل اليوم.
وعلاوة على ذلك ، لم يكن لدينا في السابق مثل هذه السهولة للوصول إلى تكنولوجيات استشعار البيانات الخام الرخيصة والقادرة ، والأجهزة ، وهلم جرا التي تؤدي إلى توليد مجموعات البيانات الهائلة اليوم.
إذن من أين تأتي هذه البيانات بالضبط ؟ ويتم جمع كميات كبيرة من البيانات من الأجهزة النقالة ، والاستشعار عن بعد ، والموقع الجغرافي ، وتطبيقات البرامج الحاسوبية ، وأجهزة الوسائط المتعددة ، وقراء التعرف على الترددات اللاسلكية ، وشبكات الاستشعار اللاسلكية ، وما إلى ذلك.
ومن بين المكونات الأساسية للبيانات الضخمة ما يسمى بنموذج "3Vs". ويمثل هذا النموذج خصائص وتحديات البيانات الكبيرة مثل التعامل مع الحجم والتنوع والسرعة. شركات مثل IBM تشمل الصدق الرابع ، في حين أن ويكيبيديا تلاحظ أيضا التباين.
علوم البيانات علم البيانات معقد وينطوي على العديد من المجالات والمهارات المحددة ، ولكن التعريف العام هو أن علم البيانات يشمل جميع الطرق التي يتم بها استخراج المعلومات والمعارف من البيانات.
البيانات موجودة في كل مكان ، وتوجد بكميات ضخمة ومتزايدة بشكل كبير. ويعكس علم البيانات ككل الطرق التي يتم بها اكتشاف البيانات ، وتوقيفها ، واستخراجها ، وتجميعها ، ومعالجتها ، وتحليلها ، وتفسيرها ، ونمذجتها ، وتصويرها
والإبلاغ عنها ، وعرضها بغض النظر عن حجم البيانات التي يجري معالجتها. إن البيانات الضخمة (كما تم تعريفها قريباً) تشكل تطبيقاً خاصاً لعلم البيانات.
علم البيانات هو مجال معقد جدا ويرجع ذلك إلى حد كبير إلى تنوع وعدد التخصصات الأكاديمية والتكنولوجيات التي يعتمد عليها يتضمن علم البيانات الرياضيات والإحصاء وعلم الحاسوب والبرمجة والنمذجة الإحصائية وتكنولوجيات قواعد البيانات ومعالجة الإشارات ونمذجة البيانات والذكاء الاصطناعي
والتعلم ، ومعالجة اللغة الطبيعية ، والتصور ، والتحليل التنبؤي ، وما إلى ذلك. ينطبق علم البيانات بشكل كبير على العديد من المجالات بما في ذلك وسائل الإعلام الاجتماعية ، والطب ، والأمن ، والرعاية الصحية ، والعلوم الاجتماعية ، والعلوم البيولوجية ، والهندسة ، والدفاع
والأعمال التجارية ، والاقتصاد ، والمالية ، والتسويق ، والموقع الجغرافي ، والعديد من المجالات الأخرى.
أحدث أقدم