تعريف قاعدة البيانات هو مجموعة من المعلومات الهامة والسرية، أو البيانات، والتي يتم تخزينها في أنظمة الكمبيوتر، ويتم التحكم فيها من قبل نظام إدارة قواعد البيانات المرمز إليه بـ “DBMS”. ويتم تنظيم هذه البيانات من قبل إدارة قواعد البيانات لتسهيل الحصول عليها بسهولة وسرعة 

ماهي اكبر قاعدة بيانات في العالم ؟، حيث إنه في الوقت الحالي تعتبر قواعد البيانات من أهم الطرق المتبعة في حفظ وترتيب البيانات والجداول الأرشيفية، وفي هذا المقال سنتحدث بالتفصيل عن قواعد البيانات، كما وسنوضح ما هي أكبر قاعدة بيانات موجودة في العالم.

في الواقع تستخدم معظم قواعد البيانات لغة الإستعلام الهيكلية SQL لكتابة البيانات والإستعلام عنها. وإن لغة الإستعلام الهيكلية SQL تستخدمها جميع قواعد البيانات العلائقية تقريباً للإستعلام عن البيانات ومعالجتها وتعريفها، ولقد تم تطوير لغة SQL لأول مرة من قبل شركة IBM في السبعينيات من القرن الماضي.

أنواع قواعد البيانات

هناك أنواع مختلفة من قواعد البيانات تعتمد على خصائص البيانات التي تخزنها وطريقة تخزين هذه البيانات ومن أهم أنواع قواعد البيانات التي يحتاج المبرمج لفهمها:

  1. قواعد البيانات العلاقية Relational Databases.
  2. قواعد البيانات غير العلاقية Non-Relational Databases.
  3. قواعد البيانات كائنية التوجه Object Oriented Databases.
  4. قواعد البيانات السحابية Cloud Databases.
  5. قواعد البيانات المركزية Centralized Databases.
  6. قواعد البيانات الموزعة Distributed Databases.

سنتعرف في الفقرات التالية على شرح مفصل عن كل نوع من هذه الأنواع وأهم مميزاتها وحالات استخدامها.

1. قواعد البيانات العلاقية SQL

قواعد البيانات العلاقية Relational Databases -أو العلائقية- أو تعرف أيضًا بقواعد بيانات SQL هي من أكثر أنواع قواعد البيانات شيوعًا واستخدامًا، وهي تخزن البيانات ضمن جداول منظمة لها مخطط ثابت، ويتكون كل جدول من مجموعة من الصفوف والأعمدة التي ترتبط بعلاقات مع بعضها البعض لتشكل قاعدة بيانات ومن هنا جاءت تسميتها بالعلاقية لتميزها بوجود تلك العلاقات بين الجداول.

تمثل الأعمدة خصائص أو سمات الجدول ويمثل الصف القيمة الفعلية لهذه الخاصية ويمثل كل سطر في الجدول سجلًا ويتضمن كل جدول في قاعدة البيانات عمودًا يسمى المفتاح لا يتكرر بين سجل وآخر ويميز السجلات عن بعضها.

كي تتعامل مع البيانات المخزنة في قواعد البيانات العلاقية تحتاج لاستخدام لغة الاستعلام الهيكلية SQL وهي عبارة عن لغة برمجة قياسية تستخدم للتخاطب مع قاعدة البيانات العلاقية وتخزين البيانات فيها ومعالجتها وصيانتها.

تتميز قواعد البيانات العلاقية بأنها قابلة للتوسع وسهولة إضافة بيانات جديدة إلى الجداول دون التأثير على السجلات المخزنة مسبقًا كما أنها توفر حماية عالية للبيانات لأن البيانات مقسمة إلى جداول مما يمكننا من جعل بعض الجداول سرية وعدم السماح بالوصول إليها سوى من قبل مستخدمين بصلاحيات إدارية محددة.

تستخدم قواعد البيانات العلاقية في العديد من التطبيقات إلا أنها تعد مناسبة أكثر لمجموعات البيانات التي لها بنية منظمة يمكن نمذجتها ضمن جداول محددة ومصممة مسبقًا، كما أنها تعتبر ملائمة لمستودعات البيانات لكونها تسهل تنفيذ استعلامات معقدة على بيانات من مصادر متعددة.

من أبرز الأمثلة على قواعد البيانات العلاقية نذكر:

  • أوراكل.
  • مايكروسوفت أكسس.
  • MySQL.
  • Microsoft SQL Serve.
  • IBM Db2.
  • MariaDB.
  • PostgreSQL.

2. قواعد البيانات غير العلاقية NoSQL

نظرًا للزيادة الهائلة في حجم البيانات الموجودة والحاجة إلى تحليل البيانات الضخمة التي يتم إنشاؤها كل يوم في الشركات الكبرى وتطبيقات الويب والمتاجر الإلكترونية الضخمة، لم تعد قواعد البيانات العلاقية ملائمة للتعامل مع هذا الكم من البيانات ومعالجتها بسرعة ودعم الحوسبة السحابية لها دون تعزيزها بموارد إضافية.

هذه القيود دفعت لظهور نوع جديد من أنواع قواعد البيانات عرف باسم قواعد البيانات غير العلاقية Non-Relational Database أو ما يعرف بقواعد بيانات Not Only SQL أو اختصارًا NoSQL كي تلائم مجموعات البيانات الكبيرة بشكل أفضل وسميت بهذا الاسم لأنها لا تخزن البيانات على شكل جداول فحسب بل تعتمد على طرق وأساليب مختلفة سنتعرف عليها بعد قليل، وهي قادرة على التعامل مع مشكلات الأداء في البيانات الضخمة big data وتستطيع تحليل ومعالجة كمٍّ هائل من البيانات بمرونة وكفاءة عالية.

فقواعد البيانات غير العلاقية NoSQL Databases هي نوع من أنواع قواعد البيانات المستخدمة لتخزين مجموعة ضخمة من البيانات التي تتميز يكونها غير متجانسة وغير مرتبطة مع بعضها البعض وهي تعرف باسم البيانات غير المهيكلة Unstructured Data وهي بيانات يصعب الاحتفاظ بها في جداول لها مخطط ثابت ومنظم.

من الأمثلة على البيانات غير المهيكلة رسائل البريد الإلكتروني وصفحات الويب التي تتضمن على كمية كبيرة من البيانات المتباينة على هيئة نصوص أو صور أو مقاطع فيديو أو روابط …إلخ. لهذا السبب برز استخدام قواعد بيانات NoSQL بشكل واسع في التطبيقات الحديثة التي تحتاج لمعالجة مثل هذه.

كما تعد قواعد البيانات غير العلاقية مناسبة للاستخدام في تطبيقات نظم الزمن الحقيقي التي تتطلب سرعة في الاستجابة وتطبيقات الحوسبة السحابية وتستخدمها اليوم كبرى شركات الإنترنت مثل جوجل و أمازون لمعالجة الكم الهائل من البيانات الخاصة بها.

وتتميز قاعدة بيانات NoSQL ببساطة بنائها فلا تحتاج إلى مخطط وبنية وروابط لذلك تجدها مستخدمة في التطبيقات البسيطة التي لا تحتاج إلى بناء مخطط وهيكل وروابط في قاعدة بياناتها حيث بناء قاعدة بيانات علائقية تحتاج إلى وقت وبعض الجهد بل وأحيانًا خبرة في وضع المخطط وتنفيذه فليست بالعملية السهلة مثل بناء قاعدة بيانات غير علائقية.

ومن أبرز الأمثلة على قواعد بيانات غير علاقية نذكر:

  • Redis.
  • MongoDB.
  • Oracle NoSQL.
  • HBase.
  • Neo4j.
  • OrientDB.
  • RavenDB.
  • Amazon S3.
  • Cassandra.

توفر قواعد البيانات غير العلائقية عدة تنسيقات أو طرق لتخزين ونمذجة البيانات كالتالي:

  • قواعد بيانات المفاتيح والقيمة A key-value database: وهي أبسط أنواع قواعد البيانات غير العلاقية وتعتمد على تخزين كل عنصر على شكل خاصية أو مفتاح وقيمة مرتبطة به الأمر الذي يسهل استرداد المعلومات منها من خلال استعلامات بسيطة، ومثال عليها Redis و DynanoDB.
  • قواعد بيانات المستندات Document databases: نوع من أنواع قواعد البيانات المستخدمة لتخزين البيانات من مختلف الأنواع سواء كانت سلاسل نصية أو أرقام أو قيم منطقية أو مصفوفات أو كائنات بشكل مستندات بتنسيق JSON، وهذا النوع يساعد المطورين في تخزين البيانات باستخدام نفس تنسيق نموذج المستندات المستخدم في الشيفرات البرمجية للتطبيقات. ويعد MongoDB مثالًا شهيرًا عليها.
  • قواعد بيانات المخطط البياني Graph Databases: يستخدم هذا النوع لتخزين كميات هائلة من البيانات ضمن رسم بياني مكون من عقد تخزن كيانات البيانات وروابط تعبر عن العلاقات بين هذه العقد، من الأمثلة عليه قواعد البيانات Neo4j و Janusgraph ومن أبرز تطبيقاتها مواقع التواصل الاجتماعي التي تربط المستخدمين فيما بينهم وتقترح الصداقات المناسبة بناء على هذه الروابط.
  • قواعد بيانات الأعمدة Column Store Database يعرف هذا النوع كذلك باسم مخزن العمود العريض Wide column store وهو طريقة مشابهة لتمثيل البيانات في قواعد البيانات العلائقية إلا أن البيانات تخزن في جداول مكونة من صفوف وأعمدة عريضة أو ديناميكية قابلة للتوسع وتوفر قدرة تخزين إضافية فليس من الضروري أن يكون لكل صف نفس مجموعة الأعمدة، وتناسب أنواع محددة من البيانات مثل ملفات تعريف المستخدمين. ومن الأمثلة عليها Cassandra و HBase.

النوعان السابقان هما أهم نوعان وأكثرهما استخدامًا، وسنتطرق لهما كثيرًا، أما الأنواع التالية فهي الأقل استخدامًا ومن الجيد التعرف عليهما عن قرب أيضًا.

3. قواعد البيانات كائنية التوجه

قواعد البيانات كائنية التوجه Object Oriented Database هي نوع من قواعد البيانات قائم على مفهوم الكائنات وهو يجمع بين مبادئ البرمجة الكائنية (OOP) ومفاهيم قواعد البيانات العلاقية.

ففي قاعدة البيانات العلاقية يتم تخزين البيانات في جداول مكونة من صفوف وأعمدة وبعدها تقوم لغات البرمجة الكائنية التوجه مثل Java و C++‎ بقراءة هذه البيانات وتحويلها إلى كائنات في الذاكرة ومعالجتها وإعادة تخزينها من جديد ما يتطلب وقتًا لذا تختصر قواعد البيانات كائنية التوجه الأمر وتعمل على مبدأ تخزين البيانات الكائنات مباشرة في التخزين الدائم وتخزن الكائنات بأكملها في قاعدة البيانات.

ولكون البيانات تمثل وتخزن في نظام قاعدة البيانات كائنية التوجه بشكل كائنات تشبه كائنات العالم الحقيقي بشكل مشابه للأسلوب المستخدم في لغة البرمجة الكائنية وتعبر عن العلاقات بين هذه الكائنات فهذا يجعلها ملائمة لتصميم المشكلات المعقدة ويسهل عملية حفظ البيانات واسترجاعها بكفاءة ومرونة.

تستخدم قواعد البيانات كائنية التوجه في التطبيقات التي تتطلب أداءً عاليًا وتحتاج لاسترداد البيانات بسرعة كالمجالات البحثية والعلمية وفي مجال الاتصالات وعلم الفلك وغيرها من المجالات التي تتطلب تخزين بيانات معقدة واسترجاعها بسرعة وإجراء حسابات معقدة عليها.

هذا النوع من قواعد البيانات ليس شائع الاستخدام كقواعد البيانات العلاقية ومن أشهر قواعد البيانات كائنية التوجه هي:

  • DB4o.
  • Objectivity/DB.
  • ObjectDB.
  • ObjectDatabase++‎.
  • ObjectStore.

4. قواعد البيانات السحابية

قاعدة البيانات السحابية Cloud Database ما هي إلا قاعدة بيانات تقليدية تستفيد من ميزات الحوسبة السحابية حيث تخزن بياناتها ضمن بيئة افتراضية أو سحابة عامة أو خاصة أو هجينة ويتم تنفيذ العمليات عليها عبر منصة حوسبة سحابية عامة أو خاصة أو مختلطة تابعة لجهة خارجية.

تتميز قواعد البيانات السحابية بمرونتها وقابليتها لزيادة أو إنقاص الموارد المخصصة لكل مستخدم كسعة التخزين وعرض النطاق الترددي بكل سهولة وحسب الحاجة فأنت تدفع فقط مقابل ما تحتاجه وهذا يوفر كلفة تخزين وصيانة البيانات.

كما أنها تتيح للشركات دعم تطبيقات البرمجيات كخدمة SaaS والوصول لها عبر الإنترنت وتتميز بسهولة إدارتها وتوفير كلفة البنية التحتية والصيانة لأن مزود الاستضافة هو من يتولى هذا الأمر عادة لذا باتت الخيار المفضل للعديد من الشركات في الآونة الأخيرة لاسيما الشركات الناشئة التي لا تمتلك الميزانية الكافية لتنشئ بنية تحتية محلية خاصة بها.

هناك العديد من المنصات والشركات الكبرى التي توفر خدمات إنشاء قواعد البيانات السحابية ومن أبرزها:

  • خدمات أمازون ويب AWS.
  • منصة جوجل السحابية.
  • Oracle Database.
  • OpenStack.
  • *Kamatera Cloud.

5. قواعد البيانات المركزية

قاعدة البيانات المركزية Centralized Database هي قاعدة بيانات تخزن كافة بياناتها في مكان واحد مركزي يمكن للمستخدمين الذين يملكون الصلاحيات الوصول له من مواقع متفرقة وهذا بدوره يتيح لعدة أشخاص إمكانية العمل على نفس البيانات في الوقت ذاته.

تستخدم الشركات الكبيرة قواعد البيانات المركزية لتخزين كافة البيانات التي تريد مشاركتها بين عدة مستخدمين، معلومات العملاء وبيانات المخزون والسجلات المالية للشركة. كما يمكن يتم استخدامها من قبل المؤسسات الحكومية وفي الجامعات لإنشاء قاعدة بيانات مركزية تضم كافة بيانات المكتبات لكافة الكليات ليصل لها الطلاب من مختلف التخصصات.

تتميز قواعد البيانات المركزية بأنها تضمن جودة ودقة البيانات وتقلل من مخاطر التلاعب بها وتحافظ على اتساقها لأنها تدير البيانات في مستودع أو خادم مركزي شامل يتم الوصول له عادة عبر الاتصال بالإنترنت.

وتكون كلفة صيانتها منخفضة، إلا أنها في ذات الوقت قد لا تكون فعالة من ناحية الوقت لأن حجمها قد يكون كبيرًا جدًا الأمر الذي يزيد من زمن الاستجابة لجلب البيانات منها كما أن حدوث أي فشل في الحاسوب المركزي الذي يخزن البيانات قد يسبب فقدان كافة البيانات.

6. قواعد البيانات الموزعة

في قواعد البيانات الموزعة Distributed Database أو اختصارًا DDBs يتم تخزين البيانات في مواقع مادية مختلفة لكنها تكون متصلة ببعضها البعض بواسطة شبكة تتيح الوصول لكافة هذه البيانات المخزنة في عدة مواقع ما يجعل هذه القواعد الموزعة تبدو للمستخدمين النهائيين كأنها قاعدة بيانات مخزنة في مكان مادي واحد.

تستخدم قواعد البيانات الموزعة لحل المشكلات التي قد تنشأ من استخدام جهاز واحد لتخزين قاعدة بيانات مركزية واحدة مثل زيادة الإنتاجية ووقت الاستجابة وقابلية التوسع.

يمكن أن تصنف قواعد البيانات الموزعة إلى نوعين مختلفين هما:

  • قواعد بيانات موزعة متجانسة Homogenous: تخزن قواعد البيانات في هذه الحالة على نفس أنواع الأجهزة التي تستخدم نفس أنظمة التشغيل وتستخدم برمجيات إدارة قواعد بيانات DBMS متطابقة ويكون كل موقع على علم بجميع المواقع الأخرى ويتعاون معها لمعالجة طلبات المستخدمين ويتم الوصول إلى قاعدة البيانات من خلال واجهة واحدة كما لو كانت قاعدة بيانات واحدة.
  • قواعد بيانات موزعة غير متجانسة Heterogenous: تخزن قواعد البيانات في هذه الحالة في مواقع مختلفة وعلى أجهزة تعمل بأنظمة تشغيل متنوعة وقد تستخدم أنواع قواعد بيانات مختلفة كذلك مثل العلاقية أو كائنية التوجه كما أنها قد تستخدم برمجيات إدارة قواعد بيانات مختلفة عن بعضها البعض وقد لا يكون أحد المواقع على علم بوجود المواقع الأخرى للبيانات مما ينتج عنه محدودية في معالجة بعض الطلبات.

أهمية قاعدة البيانات في حياة الإنسان

تحتوي قاعدة البيانات على عدد لا يحصى من المهام المهمة والفوائد التي توفرها للفرد. عندما يقوم الفرد بإضافة بياناته ومعلوماته السرية إلى قاعدة البيانات. يشعر بالارتياح، حيث يتم تخزين بياناته في مكان آمن لا يمكن أبدا أن تفقد. والأهم من ذلك هو توفرها وسهولة الوصول إليها في أي وقت. بحيث يمكن للفرد الحصول على جميع بياناته السرية المخزنة بنقرة واحدة .

تفيد قاعدة البيانات الفرد في توفير الجهد و كسب الوقت ، و كذلك كسب عملاء جدد . بالتأكيد يتسائل الكثيرين في كيف يمكن كسب عملاء جدد من خلال قاعدة بيانات ؟ على سبيل المثال ، تطبيق انستغرام . من خلال اخذه لملفات الكوكيز أو ملفات تعريف الارتباط الخاص في هاتفك ، فيمكنه معرفة ما تبحث عنه .

و على هذا الأساس سيعرض لك إعلانات قمت بالبحث عنها مؤخرا ،  كيف ؟  على سبيل للمثال ، قمت في البحث على قوقل على مطعم قريب من منطقتك . سيعرض لك تطبيق الانستغرام جميع الإعلانات التي تخص المطاعم القريبة من منطقتك ، و هكذا إلى باقي الإعلانات . و بذلك سيكسب اصحاب الإعلانات عملاء جدد .

مشاكل قاعدة البيانات

بالرغم من الفوائد العديدة لقاعدة البيانات كما ذكرنا سابقًا، إلا أنهناك عدة مشاكل مرتبطة بها، وتشمل ما يلي:

  • تتطلب متطلبات مادية كبيرة نوعا ما .
  • تتطلب مساحة أو ذكرة كبيرة .
  • تتطلب صيانة كل فترة .
  • تتطلب تعديل من حين إلى اخر .
  • تتطلب تأمين عالي .
  • تحتاج إلى دعم وإعادة تشغيل من حين لآخر .
  • تستخدم بعض الشركات لكسب الأرباح المالية .
  • في حال توقف قاعدة البيانات عن العمل، سيتوقف استخدام المستخدمين للبيانات أيضاً .

ماهي اكبر قاعدة بيانات في العالم

إن قاعدة البيانات هي برنامج يستخدم لتخزين البيانات والمعلومات وحفظها. وكلما زاد حجم البيانات المخزنة كلما كانت قاعدة البيانات أكبر وأضخم، وفي ما يلي أكبر عشر قواعد للبيانات في العالم، وهي كالأتي:

مركز البيانات العالمي للمناخ

يعد مركز البيانات العالمي للمناخ WDCC الذي يديره معهد ماكس بلانك للأرصاد الجوية والمركز الألماني للحوسبة المناخية. أكبر قاعدة بيانات في العالم، حيث يضم مركز البيانات العالمي للمناخ حوالي 220 تيرابايت من البيانات التي يمكن الوصول إليها من خلال الإنترنت. وتتضمن هذه البيانات معلومات عن أبحاث المناخ والإتجاهات المناخية المتوقعة. بالإضافة إلى 110 تيرابايت من بيانات محاكاة المناخ، كما ويخزن مركز WDCC ستة بيتابايت من المعلومات الإضافية المناخية على أشرطة مغناطيسية لسهولة الوصول إليها.

مركز الحوسبة العلمية لبحوث الطاقة الوطنية

إن المركز القومي لأبحاث الطاقة والحوسبة العلمية NERSC يعد ثاني أكبر قاعدة بيانات في العالم. وإن هذا المركز موجود في أوكلاند في كاليفورنيا. وتعود ملكية هذا المركز إلى مختبر لورانس بيركلي الوطني ووزارة الطاقة الأمريكية. وإن قاعدة البيانات هذه مخصصة لمجموعة ضخمة من المعلومات عن أبحاث الطاقة الذرية وتجارب فيزياء الطاقة العالية ومحاكاة نشأة الكون. وتضم قاعدة بيانات المركز القومي لأبحاث الطاقة والحوسبة العلمية حوالي 2.8 بيتابايت من المعلومات.

شركة AT&T

حيث تحتفظ شركة AT&T وهي أقدم شركة إتصالات في الولايات المتحدة. بواحدة من أكبر قواعد البيانات في العالم، وتمتلك هذه الشركة حوالي 312 تيرابايت من البيانات. وتتضمن هذه البيانات سجلات المكالمات البالغ عددها 1.9 تريليون بيانات عن الرقم الذي تم الإتصال به ووقت المكالمة ومدتها والعديد من المعلومات الآخرى.

شركة جوجل

على الرغم من عدم وجود الكثير من المعلومات حول الحجم الحقيقي لقاعدة بيانات شركة جوجل. إلا أن هناك الكثير من المعلومات المعروفة عن كمية وأنواع المعلومات التي تجمعها هذه الشركة. حيث أنه في المتوسط تخضع شركة جوجل لحوالي 91 مليون عملية بحث يومياً. وهو ما يمثل حوالي من 50% من إجمالي نشاط البحث على الإنترنت. وتخزن قاعدة بيانات جوجل كل بحث يقوم به المستخدم عبر الإنترنت. ولذلك يتوقع وجود أكثر من 33 تريليون سجل في قاعدة بيانات شركة جوجل. وهذا ما يعادل مئات من التيرابايت من المعلومات.

شركة سبرينت

حيث إن شركة سبرينت (بالإنجليزية: Sprint)، هي واحدة من أكبر شركات الإتصالات في العالم. وتقدم خدمات الهاتف المحمول لأكثر من 53 مليون مشترك. وتشتهر شركات الإتصالات الكبيرة سبرينت بإمتلاكها قواعد بيانات ضخمة لتتبع جميع المكالمات التي تجري على شبكتها. حيث تعالج قاعدة بيانات سبرينت أكثر من 365 مليون سجل لتفاصيل المكالمات والقياسات التشغيلية يومياً. ولذلك تحتوي قاعدة بيانات سبرينت على حوالي 2.85 تريليون صف قاعدة بيانات. مما يجعلها أكبر قاعدة بيانات تحتوي على أكبر عدد من الصفوف.

موقع ChoicePoint

حيث يعمل موقع ChoicePoint في مجال الحصول على المعلومات حول السكان الأمريكيين. مثل العناوين وأرقام الهواتف، وسجلات القيادة، والتاريخ الإجرامي وغيرها من المعلومات عن السكان الأمريكيين. ويجمع هذا الموقع هذه البيانات ليتم بيعها. ومن المتوقع وجود حوالي 250 تيرابايت من البيانات الشخصية في قاعدة بيانات هذا الموقع. تتضمن هذه البيانات معلومات عن 250 مليون شخص.

موقع يوتيوب

إن موقع يوتيوب هو أكبر مكتبة لمقاطع الفيديو عى الإنترنت. حيث يتم مشاهدة حوالي 100 مليون مقطع يومياً على هذا الموقع. وهو ما يمثل أكثر من 60% من جميع مقاطع الفيديو التي تتم مشاهدتها عبر الإنترنت. كما ويتم إضافة حوالي 65000 مقطع فيديو كل يوم على هذا الموقع. ولذلك يقدر وجود حوالي 100 تيرابايت من مقاطع الفيديو على هذا الموقع.

موقع أمازون

حيث يحتفظ موقع أمازون وهو أكبر متجر بيع بالتجزئة في العالم، بسجلات كبيرة حول 59 مليون عميل نشط. وتتضمن هذه السجلات المعلومات الشخصية العامة مثل العنوان ورقم الهاتف، والإيصالات، وقوائم الرغبات. وغيرها من البيانات والمعلومات حول المستخدمين، ولذلك يتوقع وجود أكثر من 42 تيرابايت من البيانات في قاعدة بيانات موقع أمازون.

وكالة الإستخبارات المركزية

حيث تعمل وكالة الإستخبارات المركزية CIA على جمع وتوزيع البيانات والمعلومات عن الأشخاص والأماكن حول العالم. ويتم إضافة حوالي 100 عنصر بموجب قانون حرية المعلومات كل شهر في قاعدة البيانات هذه. كما وإن قاعدة بيانات وكالة الإستخبارات المركزية تمتلك إحصائيات شاملة لأكثر من 250 دولة وكياناً حول العالم. وفي الحقيقة لم يتم التعرف على حجم البيانات في قاعدة البيانات الخاصة بهذه الوكالة. الا أنه يقدر حجم هذه البيانات فيها بحوالي 25 تيرابايت من البيانات.

مكتبة الكونجرس

إن مكتبة الكونجرس تعد أكبر مكتبة في العالم. حيث تضم مكتبة الكونجرس LC أكثر من 130 مليون مادة مثل الصور والمقاطع الصوتية ومقاطع الفيديو والخرائط. وتضم ايضاً حوالي 29 مليون كتاب و5 ملايين مستند رقمي. ولذلك تشير التقديرات إلى أن الجزء النصي من مكتبة الكونغرس يتألف من 20 تيرابايت من البيانات.