12+
Введение в базы данных

Бесплатный фрагмент - Введение в базы данных

Введение

Причина широкого применения средств электронно-вычислительной техники связана с информационным взрывом, сущность которого состоит в том, что количество информации, которое человек должен воспринимать и перерабатывать лавинообразно растет (так называемый экспоненциальный закон информации). Это касается экономики и техники, наук и технологии, медицины и социального обеспечения. Информация, данные все чаще рассматриваются как общие, жизненно важные национальные ресурсы, которые должны быть организованы так, чтобы ценность их была по возможности максимальной.

Перерабатывать большой объем информации в заданные сроки практически невозможно без специальных средств обработки информации. Хотя большая часть информации все еще находится вне ЭВМ, однако, стоимость запоминающих устройств вычислительных машин быстро снижается, поэтому хранить данные в файлах ЭВМ будет дешевле, чем на бумаге.

Резкий рост перерабатываемой информации и накопленный опыт использования электронно-вычислительной техники в различных областях приводят к необходимости пересматривать такую традиционную область управления информацией, как управление данными.

Новый подход к организации процессов обработки данных нашел наиболее яркое выражение в концепциях банков данных, которые позволили принципиально по-новому подойти к вопросам управления информацией в автоматизированных системах. Автоматизированные системы управления, спроектированные на основе концепций банков данных, обладают рядом характерных свойств, выгодно отличающих их от предшествующих разработок, основой которых была система массивов данных, ориентированная на решение комплекса установившихся задач. Использование автоматизированных банков данных позволяет обеспечить многоаспектный доступ к совокупности взаимосвязанных данных, интеграцию и централизацию управления данными, устранение излишней избыточности данных, возможность совмещения эффективных режимов пакетной и телепроцессорной обработки данных.

Автоматизированный банк данных определяют как систему информационных, математических, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоаспектного использования данных для получения необходимой информации. В автоматизированном банке данных часть функций выполняется различными элементами вычислительной техники, а другая — человеком.

Массив данных, хранимый в вычислительной системе, называется базой данных. База данных вместе с системой управления ею является составной частью банка данных. При создании баз данных необходимо уделить особое внимание тому, чтобы данные можно было широко использовать в различного рода приложениях и чтобы способы использования данных можно было легко и быстро изменять. До появления баз данных было чрезвычайно трудно изменить способ организации используемых данных.

Различные программисты по-разному представляли данные и постоянно стремились их модифицировать по мере возникновения новых задач. Эти модификации вызывали значительные изменения существующих программ и поэтому их выполнение обходилось дорого. Для обеспечения гибкости использования данных необходимо учитывать два аспекта разработки баз данных: во-первых, данные должны быть независимы от программ, использующих их, для того, чтобы данные можно было добавлять или перестраивать без изменения программ; во-вторых, должна быть обеспечена возможность запрашивать и отыскивать информацию в базе данных без трудоемкого написания программ на обычном языке программирования.

Таким образом, проектирование баз данных должно основываться на вполне определенной системе положений — четко сформулированной концепции.

Концепция баз данных стала определяющим фактором при создании эффективных систем автоматизированной обработки информации.

Базы и банки данных являются одними из основных компонентов автоматизированных систем различных уровней и типов (АСУП — автоматизированных систем управления предприятиями, АСУ ТП –автоматизированных систем управления технологическими процессами, ОАСУ — отраслевых автоматизированных систем управления, АСНИ — автоматизированных систем управления научными исследованиями, САПР — систем автоматизации проектирования и т.п.). Они создаются для многих сфер и отраслей народного хозяйства: планирования, учета, управлениями предприятиями, статистики, здравоохранения и др.

Поэтому проектирование автоматизированных систем управления различного назначения должно включать в себя и проектирование банков данных.

Информация и данные

Под информацией понимают любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Понятие об информации как о знании сложилось у человека уже давно. Информация создается и используется во всех областях человеческой деятельности: любая взаимосвязь и координация работ возможны только благодаря информации. Человек создал естественные информационные системы, поскольку существовала насущная потребность снабжать производство информацией, необходимой при контроле и принятии решений, научился собирать эту информацию, обрабатывать и передавать ее по назначению.

Процесс осмысливания понятия информации и ее роли в жизни и деятельности человека продолжается. Понятие информации вместе с другими научными понятиями позволяет более глубоко познать законы развития материального мира. На современном этапе считается, что оно является общим для всех видов и форм движения материи и связывается с тем или иным неотъемлемым свойством или атрибутом материи (отражением, разнообразием, структурой, неоднородным распространением вещества и энергии в пространстве и времени и т.д.).

Данные можно определить как информацию, фиксированную в определенной форме, пригодной для последующей обработки, хранения и передачи.

Соответственно двум понятиям — «информация» и «данные» — в банках данных различают два аспекта рассмотрения вопросов: инфологический и дат алогический.

Инфологический аспект употребляется при рассмотрении вопросов, связанных со смысловым содержанием данных независимо от способа их представления в памяти системы.

На этапе инфологического проектирования информационной системы должны быть решены вопросы:

1) о каких объектах или явлениях реального мира требуется накапливать и обрабатывать информацию о системе;

2) какие их основные характеристики и взаимосвязи между собой будут учитываться;

3) уточнения вводимых в информационную систему понятий об объектах и явлениях, их характеристиках и взаимосвязях.

Таким образом, на этапе инфологического проектирования выделяется часть реального мира, определяющая информационные потребности системы, т.е. ее предметную область.

Даталогический аспект употребляется при рассмотрении вопросов представления данных в памяти информационной системы.

При даталогическом проектировании системы исходя из возможностей имеющихся средств восприятия, хранения и обработки информации разрабатываются соответствующие формы представления информации в системе посредством данных, а также приводятся модели и методы представления и преобразования данных, формулируются правила смысловой интерпретации данных.

По своему назначению банк данных (БнД) — это информационная система. Предметная область (ПО) — это область применения конкретного банка данных. Различают банки данных, применяемые в сфере управления предприятиями и организациями, транспортом, а медицине, научных исследованиях и т. д. В настоящее время банки данных широко используются в составе таких автоматизированных систем, как АСУ различных уровней управления народным хозяйством, автоматизированные справочные системы различного профиля, системы автоматизированного проектирования и т. д.

Предметная область — информационная сторона функционирования автоматизированной системы, отражающая множество объектов и связей между ними. Под предметной областью принято понимать часть реального мира, подлежащую изучению с целью организации управления и в конечном счете автоматизации. Это м/б предприятие, министерство, ВУЗ, служба управления городом. Предметная область представляется фрагментов: например, предприятие — бухгалтерия, отдел кадров, планово-финансовая служба и т. д.

В то же время каждый фрагмент предметной области характеризуется множеством объектов процессов, использующих объекты, а также множеством пользователей, характеризуемых единым взглядом на предметную область. В частности, для бухгалтерии объекты — всевозможные документы: договоры, исполнительные листы, трудовые соглашения, листы нетрудоспособности и др. Процессы бухгалтерии — расчет заработной платы, материальный учет, учет командировочных расходов, банковские операции и др. Пользователи данного фрагмента — сотрудники бухгалтерии, работники финансовых органов.

Предпосылки создания банков данных

Создание банков данных вызвано следующими основными предпосылками:

данные, хранящиеся в информационной системе, отражают часть реального мира; объекты реального мира находятся в сложной взаимосвязи между собой. Системность, взаимосвязанность отображаемых объектов приводит к взаимосвязанности отражающих их информационных единиц. Для того, чтобы обеспечить адекватное отображение реального мира, информационная база должна представлять собой взаимоувязанное целое;

информационные потребности различных конечных пользователей пересекаются. Создание локальных массивов приводит к значительному дублированию информации, а единая информационная база сокращает избыточность хранимых данных и обеспечивает многократное обращение к одним и тем же данным разных пользователей;

при решении любой задачи выполняется отбор данных, предварительно собранных и зафиксированных в запоминающей среде. Функции создания и ведения информационного фонда, предоставления нужной информации конечному пользователю являются общими для различных задач. Эти функции могут быть отделены от других функций по обработке данных, т.е. от логической и арифметической обработки в соответствии с потребностями конечных пользователей. Для выполнения этих функций создается специальное системное программное обеспечение;

современный уровень развития технического и программного обеспечения систем обработки данных, а также теоретического и практического опыта построения информационных систем позволяет создавать эффективные банки данных.

Роль и место банков данных в автоматизированных системах

Банк данных — это информационная система, включающая в свой состав комплекс специальных методов и средств для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей.

Банк данных выступает в роли специальной обеспечивающей подсистемы в составе автоматизированных систем (АС). Приведенное определение очерчивает границу банка данных, как подсистемы в составе автоматизированной системы. Эта граница определяется задачами поддержания информационной модели в требуемом состоянии и обеспечения (информационных запросов пользователей). Входная информация (подготовленная к вводу в информационную модель и являющаяся результатом работы подсистемы сбора и регистрации информации в АС), а также выходная информация (полученная в результате обработки информации, заключенной в модели, и поступающая на вход подсистемы распределения и отображения информации в АС) не рассматриваются как часть информационной модели.

Задача поддержания информационной модели в необходимом состоянии требует, чтобы в банке данных выполнялись операции хранения и модификации (последняя представляет собой совокупность трех операций: включить, удалить, изменить данные) информационной модели в соответствии с возникающими изменениями в состоянии объектов предметной области. Кроме того, с развитием АС видоизменяются состав объектов предметной области и связи между ними, что также должно найти отражение в соответствующих изменениях информационной модели. При этом в рассматриваемых АС используется самая разнообразная по смысловому содержанию информация, представленная в различных кодах. Поэтому организация банков данных должна быть достаточно гибкой, чтобы обеспечивать использование информации различных видов и изменять при необходимости структуру хранимой информации.

Задача обеспечения информационных запросов пользователей имеет два аспекта, которые необходимо рассматривать и учитывать при проектировании банков данных. Первый аспект — это определение границ конкретной предметной области и разработка описания соответствующей информационной модели. Банк данных должен обеспечивать автоматизированную систему всей необходимой информацией, а в идеальном случае и той, которая может потребоваться при дальнейшем расширении АС.

Второй аспект — разработка банка данных, ориентированного на эффективное обслуживание запросов пользователей. Исходя из этого, следует проанализировать типы и виды запросов тех лиц, которые будут пользоваться услугами банка данных, а также функциональные задачи АС, для которой банк данных является источником информации.

Пользователей банка данных можно разделить на две группы по признаку постоянства общения с банком данных. Постоянные пользователи — такие, которые регулярно пользуются услугами банка данных и для которых можно заранее сформулировать типы запросов, определяющие круг их интересов. Предварительное определение тематики запросов пользователей необходимо для организации эффективной обработки запросов.

Постоянные пользователи могут обращаться к системе с произвольными по содержанию запросами. Разовые пользователи — те, которые не имеют постоянных запросов, но могут обращаться к системе с произвольными по содержанию запросами.

Наличие постоянных и разовых пользователей в автоматизированной системе, а следовательно, наличие потока регламентированных и произвольных по содержанию запросов требуют разработки специальных подходов к определению границы ПО и проектированию состава элементов информационной модели. Если бы в автоматизированной системе существовало только поток регламентированных запросов и не ожидалось развития системы, то можно было определить границы ПО и выполнить проектирование исходя из анализа содержания всей совокупности запросов пользователей — это так называемый подход к проектированию «от запросов пользователей». Наличие потока произвольных по содержанию запросов и развитие автоматизированной системы во времени не позволяют в полной мере использовать подход от запроса. В этом случае необходим поход, позволяющий выполнить прогноз смыслового содержания ожидаемой совокупности произвольных запросов. Таким является подход, называемый «от реального мира». С помощью экспертов определяются границы предметной области — состав объектов, их свойства и отношения с учетом развития системы, и затем проектируется модель. Этот подход базируется на предположении, что произвольные запросы пользователей соответствуют тематической направленности АС.

Подход «от реального мира» — основной, подход «от запросов пользователей» используется для уточнения границ предметной области.

Наибольшее применение он получает в период использования автоматизированной системы, когда при работе накапливается достаточно информации о содержании произвольных запросов и необходимо выполнить коррекцию границ ПО и состава элементов информационной модели.

Пользователей банка данных различают также по уровню компетенции, характеризующему возможность доступа пользователей к тем или иным данным. Речь идет о защите определенной части данных от тех пользователей, которые по различным причинам не должны иметь возможность их получения или изменения. Следовательно, банк данных должен иметь специальные средства для обеспечения санкционированного доступа пользователей к данным.

Пользователи банка данных отличаются друг от друга по форме представления запросов, с которыми они обращаются к системе, а также по форме представления затребованной информации.

Пользователи прикладные программисты — особая категория пользователей. Они выполняют работы по программированию функциональных задач.

Так как АС всегда является развивающейся системой (один из принципов создания автоматизированной системы — принцип непрерывного развития), то расширяется круг задач, которые должны решаться в изменяющихся условиях функционирования. Кроме того, при работе АС может возникнуть ситуация, когда целесообразно составить прикладную программу для обработки ряда запросов, которые предполагались произвольными, но оказались относительно постоянными по содержанию и времени поступления. Поэтому в составе обслуживающего персонала АС имеются специалисты в области обработки данных, выполняющие программирование функциональных задач, т.е. разрабатывающие прикладные программы.

Пользователи этой категории обычно умеют работать на нескольких алгоритмических языках программирования, знакомы со средствами обработки, имеющегося в составе используемого банка данных. Для обеспечения нормальной работы этой категории пользователей необходимо наличие в системе словаря данных и хорошо поставленной службы слежения за его состоянием. Из словаря данных узнают о наличии соответствующих типов данных, их структуре и связях между ними, обо всех изменениях, происходящих в структуре информационной модели.

Пользователи-непрограммисты — наиболее многочисленная группа лиц, для удовлетворения информационных потребностей которых и создается банк данных. Поэтому пользователей-непрограммистов еще называют конечными пользователями. Это специалисты в своей области деятельности (руководители подразделений предприятия, работники медицинских учреждений, читатели тематических библиотек, кассиры в сберегательных кассах и т.д.), которые обычно не имеют специальной подготовки по программированию. Они охотнее обращаются к системе, если не требуется много затрат на подготовку запроса. Для этой группы пользователей идеальной может быть система, общение с которой выполняется на естественном языке. Поэтому целесообразно обеспечивать конечных пользователей специальным формализованным языком запросов, напоминающий естественный язык, и работать на этом языке в режиме диалога «пользователь-система», целью которого является уточнение запроса пользователя, оказания пользователю помощи в ознакомлении с возможностями системы.

Таким образом, услугами банка данных пользуется большее число разнородных пользователей. Поэтому в банках данных предусматривается специальное средство приведения всех запросов к единой терминологии — словарь данных. Кроме того, используются специальные методы эквивалентных грамматических преобразований запросов для построения оптимальных процедур их обработки, специальные методы организации доступа к одним и тем же данным различных пользователей при совпадении во времени поступивших запросов.