3.3.3. Неполнота средств идентификации объектов в модели
В теории и практике до сих пор сохраняется двойственное отношение к ФЗ, МЗ и к нормальным формам. С одной стороны, их определение чисто синтаксическое и связано с локальными количественными характеристиками соответствий между атрибутами в данном отношении в определенный момент времени. С другой стороны, понимая недостаток таких "локальных" определений, авторы многих работ связывают с ФЗ и МЗ некие "глобальные", универсальные для всей предметной области характеристики.
Примером этому может служить цитата из работы [3, c. 288]: "... уровень нормализации данного отношения определяется семантикой, а не конкретными значениями данных, в некоторый момент времени. Нельзя с первого взгляда на таблицу с данными для заданного отношения определить, находится оно, например в 3НФ. Для этого также необходимо представлять себе их смысл, т. е. существующие между ними зависимости. Следует также отметить: даже зная о зависимостях данного отношения, нельзя доказать того, что оно находится в 3НФ. В таком случае можно лишь показать, что эти данные не нарушают никаких зависимостей, и, если это так, высказать предположение о том, что эти данные не противоречат гипотезе о принадлежности отношения к 3НФ. Однако этот факт не гарантирует, что предложенная гипотеза верна".
Считая это утверждение по меньшей мере дискуссионным и перенося обсуждение своих аргументов в пользу этой дискуссионности в следующее пособие [3], отметим однако, что одна из бинарных операций алгебры Кодда: соединение по предикату равенства (эквисоединение), - требует для своей истинности именно такой "локальной" формализованности отношений-операндов, наличия в данный момент времени ФЗ или МЗ, определяемых содержанием таблиц этих отношений и фиксируемой ключами отношений. Кодд установил, что эквисоединение семантически верных отношений может дать семантически ложное отношение, при этом пользователь не в состоянии выявить момент появления в базе данных ложной информации.
Напомним, что примером ловушки соединения является отношение R26 (рис. 79) - результат эквисоединения отношений R15 и R25, представленных на рис. 70 и 78.
Известно, что для истинности λ-соединения необходимо, чтобы группы атрибутов в отношениях-операндах, на которых определяется предикат λ, были бы аргументами ФЗ или МЗ. Если же это требование не выполняется, то ловушка соединения нарушает как соответствие логической модели предметной области, так и истинность модели.
В основном, эти противоречия, как выявленные авторами ранее, так и приводимые здесь, сводятся к невозможности установить соответствие между меняющейся предметной областью и традиционной реляционной моделью базы данных.
Известно, что средства нормализации и средства задания ограничений (ФЗ и МЗ) были введены в реляционный подход для отражения части, хотя и малой, семантики реального мира, для устранения избыточности в данных. Так например, в работе [3, c. 281] указывается: "... ФЗ как семантическое понятие. Конечно, ФЗ - это особый вид ограничений целостности, а поэтому это, несомненно семантическое понятие. Распознавание ФЗ является частью процесса выяснения смысла тех или иных данных".
Формулируя эти же идеи по-другому, можно сказать, что ФЗ и МЗ должны выделять сущности (объекты или связи) реального мира, а нормальные формы должны обеспечивать наиболее рациональный способ изображения этих сущностей в базе данных и гарантировать их сохранность.
Остановимся вначале на возможности выделения сущностей реального мира средствами ФЗ и МЗ. При этом будем рассматривать такие зависимости как "глобальные" для базы данных.
Утверждение 1. Имеются сущности, отличные от тех, которые выделяются средствами ФЗ и МЗ [6].
Доказательство. Воспользуемся отношением R6 (рис. 57), где для схемы отношения ПРЕПОДАВАТЕЛЬ (Шифр, Фамилия, Должность, Оклад) определена структура функциональных зависимостей: ШифрФамилия, ШифрДолжность, ШифрОклад и ДолжностьОклад.
Утверждение 2. Нормализация не обеспечивает сохранение сущностей, которые не выделяются средствами ФЗ и МЗ [6].
Доказательство. Рассмотрим отношение R27(A, B, C, D), представленное на рис. 80.
| A | B | C | D |
| A1 | B1 | C1 | D2 |
| A1 | B2 | C1 | D1 |
| A2 | B2 | C1 | D1 |
| A2 | B1 | C1 | D2 |
| A4 | B3 | C2 | D2 |
| A5 | B4 | C3 | D3 |
| A5 | B5 | C3 | D3 |
| A3 | B1 | C2 | D2 |
| A6 | B6 | C3 | D4 |
Рис. 80. Отношение R27
Пусть постулированы ФЗ: AC и BD. Тогда легко показать, что атрибуты A и B составляет возможный ключ и, следовательно, оптимальное синтаксическое разложение по алгоритму Неклюдовой - Цаленко [2] будет представлено отношениями R28, R29 и R30, показанными на рис. 81.
|
|
|
| Отношение R28 | Отношение R29 | Отношение R30 |
Рис. 81. Декомпозиция отношения R27
Если в процессе изменения предметной области модифицировать отношение R28, удалив кортеж
Случай с МЗ иллюстрируется отношением R31 (A, B, C, D, E), которое представлено на рис. 82. Отношение R31 находится в 3НФ, но не в 4НФ (имеют место нетривиальные МЗ AB и AC,D, а атрибут A не является ключом отношения).
A B C D E A1 B1 C1 D1 E1 A1 B1 C2 D2 E1 A2 B2 C1 D2 E2 A2 B2 C2 D3 E1 A2 B3 C1 D2 E2 A2 B3 C2 D3 E1
Рис. 82. Отношение R31
Приведение к 4НФ представлено отношениями R32 и R33 (рис. 83).
|
|
| Отношение R32 | Отношение R33 |
Рис. 83. Проекции отношения R31
То, что отношения R31 и R32 действительно находятся в 4НФ, можно проверить, доказав, что все их МЗ тривиальны.
Для этого достаточно воспользоваться определением многозначной зависимости Делобеля из работы [11] или Фейджина [10].
Обратите внимание, что для восстановления исходного отношения R31 (рис. 82) из проекций R32 и R33 система должна помнить необычное правило, позволяющее восстанавливать исходное отношение, т.к. в R32 и R33 атрибут A не является ключом.
Теперь после удаления кортежа
Утверждение 3. Нормализация не обеспечивает сохранности сущностей, выделяемых ФЗ и МЗ.
Доказательство. Рассмотрим отношение R34 (A, B, C), показанное на рис. 84. Структура ФЗ, заданных на этом отношении, такова: AB C; AB, CB .
Очевидно, что A1 - ключ. Тогда R34 не находится в 3НФ. Действительно, в проекции R34 [A, B] нет кортежей с одинаковыми значениями из домена атрибута A, так как имеет место AB.
A B C A1 B2 C1 A2 B1 C2 A3 B2 C1 A4 B2 C3
Рис. 84. Отношение R34
Допустим, что в отношении R34 все же есть два кортежа с одинаковыми значениями атрибута A.Тогда эти кортежи должны различаться значениями атрибута B из-за ФЗ ABC. Следовательно, в проекции R34 [A, B] встречаются два кортежа с одинаковыми значениями из домена атрибута A, и разными значениями из B, что противоречит наличию заданной зависимости AB.
Следовательно, все кортежи отношения R34 обязаны различаться значениями атрибута A. Отсюда и из АBC следует, что A - ключ и AC, следовательно, имеет место транзитивная зависимость ACB.
Оптимальное синтаксическое разложение приводит к отношениям R35 и R36 (рис.85): R35 = R34 [A, C], R36 = R34 [B, C], из которых исходное отношение R34 восстанавливается эквисоединением R35 [C = C] R36.
|
|
| Отношение R35 | Отношение R36 |
Рис. 85. Проекции отношения R34
Теперь, если удалить кортеж
Доказательство для МЗ проводится аналогично, с необходимыми изменениями (как и утверждения 1 и 2).
Следствие доказанных утверждений состоит в том, что если постулировать зависимости в базе данных как " глобальные ", то не будет обеспечена ни полнота описания предметной области (утверждение 1), ни однозначное соответствие меняющейся предметной области (утверждения 2 и 3).
Если рассматривать зависимости "локально" применительно к данной структуре таблицы (как в п. 3.3.1) данного пособия, то и в этом случае не каждая функциональная зависимость является инвариантом реляционной модели.
Сформулируем выявленные недостатки традиционной реляционной модели:
1. Набор "глобальных" зависимостей не является инвариантом развивающейся логической модели. Понятию "развивающеяся логическая модель" может соответствовать модель, использующая средства, позволяющие полностью описывать и менять описание множества сущностей реальности, сохраняя тем самым требуемое соответствие с реальностью.
2. В результате потери или приобретения " локальных " ФЗ или МЗ в базе данных может произойти непредвиденное или необнаруживаемое заранее появление ложной информации или потеря истинной информации.
3. В базе данных ни одна совокупность атрибутов не может гарантировать однозначный выбор кортежей, так как реляционные ключи могут разрушаться.
4. Двойственность используемых в теории баз данных понятий ФЗ и МЗ и других типов зависимостей, приводит к противоречиям между их семантической " глобальностью " и математической "локальностью", что не дает возможности полностью опираться на эти ограничения при формировании модели предметной области.
[ Назад  Начало раздела
Далее Содержание]