پایگاه‌های داده‌ها معمولاً در قالبی که برای دستگاه‌ها و رایانه‌ها قابل خواندن و دسترسی باشد ذخیره می‌شوند. البته چنین شیوه ذخیره‌سازی اطلاعات تنها روش موجود نیست و شیوه‌های دیگری مانند ذخیره‌سازی ساده در پرونده‌ها نیز استفاده می‌گردد. آن چه ذخیره‌سازی داده‌ها در پایگاه‌های داده‌ها را موثر می‌سازد وجود یک ساختار مفهومی برای ذخیره‌سازی و روابط بین داده‌ها است.

پایگاه داده در اصل مجموعه‌ای سازمان یافته از اطلاعات است.این واژه از دانش رایانه سرچشمه می‌گیرد، اما کاربرد وسیع و عمومی نیز دارد، این وسعت به اندازه‌ای است که مرکز اروپایی پایگاه داده (که تعاریف خردمندانه‌ای برای پایگاه داده ایجاد می‌کند) شامل تعاریف غیر الکترونیکی برای پایگاه داده می‌باشد. در این نوشتار به کاربردهای تکنیکی برای این اصطلاح محدود می‌شود.
یک تعریف ممکن این است که: پایگاه داده مجموعه‌ای از رکوردهای ذخیره شده در رایانه با یک روش سیستماتیک (اصولی) مثل یک برنامه رایانه‌ای است که می‌تواند به سوالات کاربر پاسخ دهد. برای ذخیره و بازیابی بهتر، هر رکورد معمولاً به صورت مجموعه‌ای از اجزای داده‌ای یا رویدادها سازماندهی می‌گردد. بخش‌های بازیابی شده در هر پرسش به اطلاعاتی تبدیل می‌شود که برای اتخاذ یک تصمیم کاربرد دارد. برنامه رایانه‌ای که برای مدیریت و پرسش و پاسخ بین پایگاه‌های داده‌ای استفاده می‌شود را مدیر سیستم پایگاه داده‌ای یا به اختصار (DBMS) می‌نامیم. خصوصیات و طراحی سیستم‌های پایگاه داده‌ای در علم اطلاعات مطالعه می‌شود.

مفهوم اصلی پایگاه داده این است که پایگاه داده مجموعه‌ای از رکوردها یا تکه‌هایی از یک شناخت است.نوعا در یک پایگاه داده توصیف ساخت یافته‌ای برای موجودیت‌های نگه داری شده در پایگاه داده وجود دارد: این توصیف با یک الگو یا مدل شناخته می‌شود. مدل توصیفی، اشیا پایگاه‌های داده و ارتباط بین آنها را نشان می‌دهد. روش‌های متفاوتی برای سازماندهی این مدل‌ها وجود دارد که به آنها مدل‌های پایگاه داده گوییم. پرکاربردترین مدلی که امروزه بسیار استفاده می‌شود، مدل رابطه‌ای است که به طور عام به صورت زیر تعریف می‌شود: نمایش تمام اطلاعاتی که به فرم جداول مرتبط که هریک از سطرها و ستونها تشکیل شده است(تعریف حقیقی آن در علم ریاضیات برسی می‌شود). در این مدل وابستگی‌ها به کمک مقادیر مشترک در بیش از یک جدول نشان داده می‌شود. مدل‌های دیگری مثل مدل سلسله مراتب و مدل شبکه‌ای به طور صریح تری ارتباط‌ها را نشان می‌دهند.

در مباحث تخصصی‌تر اصطلاح پایگاه داده به صورت مجموعه‌ای از رکوردهای مرتبط با هم تعریف می‌شود. بسیاری از حرفه‌ای‌ها مجموعه‌ای از داده‌هایی با خصوصیات یکسان به منظور ایجاد یک پایگاه داده‌ای یکتا استفاده می‌کنند.

معمولاً DBMSها بر اساس مدل‌هایی که استفاده می‌کنند تقسیم بندی می‌شوند: ارتباطی، شی گرا، شبکه‌ای و امثال آن. مدل‌های داده‌ای به تعیین زبانهای دسترسی به پایگاه‌های داده علاقه مند هستند. بخش قابل توجهی از مهندسی DBMS مستقل از مدل‌های می‌باشد و به فاکتورهایی همچون اجرا، هم‌زمانی، جامعیت و بازیافت از خطاهای سخت افزاری وابسطه‌است.در این سطح تفاوت‌های بسیاری بین محصولات وجود دارد.

تاریخچه پایگاه داده

اولین کاربردهای اصطلاح پایگاه داده به ژوئن ۱۹۶۳ باز می‌گردد، یعنی زمانی که شرکت System Development Corporation مسئولیت اجرایی یک طرح به نام «توسعه و مدیریت محاسباتی یک پایگاه داده‌ای مرکزی» را بر عهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه ۷۰ در اروپا و در اواخر دهه ۷۰ در خبر نامه‌های معتبر آمریکایی به کار رفت.(بانک داده‌ای یا در اوایل سال ۱۹۶۶ در روزنامه واشینگتن پست کار رفت)

اولین سیستم مدیریت پایگاه داده در دهه ۶۰ گسترش یافت. از پیشگامان این شاخه چارلز باخمن می‌باشد. مقالات باخمن این را نشان داد که فرضیات او کاربرد بسیار موثرتری برای دسترسی به وسایل ذخیره سازی را محیا می‌کند. در آن زمانها پردازش داده بر پایه کارت‌های منگنه و نوارهای مغناطیسی بود که پردازش سری اطلاعات را مهیا می‌کند. دو نوع مدل داده‌ای در آن زمانها ایجاد شد:CODASYL موجب توسعه مدل شبکه‌ای شدکه ریشه در نظریات باخمن داشت و مدل سلسله مراتبی که توسط North American Rockwell ایجاد شد و بعدا با اقباس از آن شرکت IBM محصولIMS را تولید نمود.
مدل رابطه‌ای توسط E. F. Codd در سال ۱۹۷۰ ارائه شد.او مدل‌های موجود را مورد انتقاد قرار می‌داد. برای مدتی نسبتاً طولانی این مدل در مجامع علمی مورد تایید بود. اولین محصول موفق برای میکرو کامپیوترها dBASE بودکه برای سیستم عامل هایCP/M و PC-DOS/MS-DOS ساخته شد. در جریان سال ۱۹۸۰ پژوهش بر روی پایگاه‌های مدل توزیع شده و ماشین‌های پایگاهی (database machines) متمرکز شد، اما تأثیر کمی بر بازار گذاشت. در سال ۱۹۹۰ توجهات به طرف مدل شی گرا جلب شد. این مدل جهت کنترل داده‌های مرکب لازم بود و به سادگی بر روی پایگاه داده‌های خاص، مهندسی داده(شامل مهندسی نرم افزار منابع) و داده‌های چند رسانه‌ای کار می‌کرد.

در سال ۲۰۰۰ نوآوری تازه‌ای رخ داد و پایگاه اکس‌ام‌ال (XML) به وجود آمد. هدف این مدل از بین بردن تفاوت بین مستندات و داده‌ها است و کمک می‌کند که منابع اطلاعاتی چه ساخت یافته باشند یا نه در کنار هم قرار گیرند.

مدل‌های پایگاه داده

الگوی کاری کاربران پایگاه داده‌ها را در سطح منطقی مشخص می‌کند. شگرد‌های مختلفی برای مدل‌های داده‌ای وجود دارد. برای هر یک از مدل‌های منطقی اجراهای فیزیکی مختلفی قابل پیاده سازی است و سطوح کنترل مختلفی در انطباق فیزیکی برای کاربران محیا می‌کند. این مدل‌ها عبارتند از مدل تخت، مدل سلسله مراتبی، مدل شبکه‌ای و مدل رابطه‌ای. مدل رابطه‌ای اساس کار سامانه مدیریت پایگاه داده‌های امروزی است.

سامانهٔ مدیریت پایگاه داده‌ها DBMS

مقاله اصلی: سامانه مدیریت پایگاه داده‌ها یک نرم‌افزار رایانه‌ای است که با هدف مدیریت پایگاه داده‌ها طراحی شده‌است به گونه‌ای که کاربر درگیر مسائل مربوط به ذخیره و بازیابی و شاخص ‌بندی داده‌ها نمی‌شود و بر روی طراحی منطقی پایگاه تمرکز می‌نماید.