Информационные системы здравоохранения
для стран с низким уровнем доходов: Обзор
Канадское общество международного здравоохранения

 


V. Моделирование данных здравоохранения


Предоставление услугздравоохранения и мониторинг состояния здоровья требуют информацию для принятия решений о распределении ресурсов и осуществлении политики:

клиническая информация, такая как диагнозы,

информация, основанная на знаниях, такая как, лучшая медицинская практика,

статистика служб, такая как, госпитализации и число иммунизаций,

статистика потребления ресурсов, такая как, потребление материалов и отработанное время,

регистры здравоохранения,

различные исследования,

статистика переписи населения,

социальная статистика, такая как, доходдомашних хозяйств, разъезды и разводы,

статистика рабочей силы, такая как, число врачей,

статистика страхования, например, искипо поводу здоровья и несчастных случаев,

текущие события, например, землетрясения и

финансовая и бухгалтерская статистика.

Разнообразие источников информации показывает разнообразие и типы элементов данных, которые должны быть собраны и проанализированы. Ключом к производству информации является то, как данные организованы, что, в зависимостиот возможностей информационной системы, может быть сложной для разработки задачей.

Пользователи, собирающие данные, считают, что они организованы в том виде форм ввода, которые они используют. Подобно этому, пользователи, которые действуют на основе информации, считают, что она (а частотакже и данные!) структурирована в том виде, как она представлена в отчете. В то время как справедливо, что ввод и вывод систем обработки информациисоответствует тому, что воспринимает пользователь, структура основныхданных может быть существенно отличной.

Проектировщик базы данных должен выполнить несколько взаимосвязанных задач по моделированию данных до того, как он или она сможет спроектировать действительную базу данных. Задачей проектировщика является построение модели, которая производит желаемую информацию правильно и рентабельно. С этой точки зрения

должны быть определены масштаб, время ипорядок информацииt,

должны быть определены источники данных и

должен быть определен алгоритм обработки.

 

Шаги по моделированию данных

Определить объекты данных

Первым шагом является определение при помощи анализа данных объектов данных. Объектом данных может быть личность, предмет или событие. Он может быть дажеабстрактным, таким как "идеальное" здоровье младенца или может быть сконструирован, подобно назначению лекарственного лечения.

Определение связей между объектами

Как только объекты определены необходимо проанализировать связи между этими объектами. Например, если объектами являются люди и информация должна включать в себя связи внутри семей, то в модели данных, как минимум, должна быть представлена связь ребенок-родитель.

Проверка начальной модели данных

Первые два шага дали модель данных, но она должна быть проверена и затем подчищена.Проверка достигается просмотром алгоритма обработки от объекта данных к желаемой информации. Например, информация утеряна, если утеряны один или более объект данных или связь.

Подчистка модели данных

"Нормализация" - хорошо определенный метод, используемый проектировщиками баз данных для подчистки модели данных. Нормализация разбивает объекты на более управляемые подобъекты, которые можно легко хранить в файлах данныхили в базе данных. Требования обработки тем не менее могут заставить разработчика выбрать необычную структуру данных, которые не полностью нормализованы или являются "де нормализованными". Базы данных и метод нормализации обсуждаются ниже.

Проверка подчищенной модели данных

Хотя трансформации нормализации являются детерминантами, часто, как только выявляются подобъекты, выявляются несогласованности в интерпретации. Процесс проверки является в тоже время использованием алгоритма обработки для выявления, что желаемая информация может быть получена из элементов данных в модели данных. Если нет доказательств, что их можно уловить, тоэлементы данных, объекты данных или отношения, бесполезные для получения информации, должны быть удалены от модели.

 

Нормализация

Как показано в следующей цитате о базах данных, ключ к нормализации лежит в удалении дублированных данных и громоздких структур данных.

База данных может быть определена как набор взаимосвязанных данных, хранящихся вместе без вредной или не необходимой избыточности, для обслуживания одной или более прикладных программ оптимальным путем, данные хранятся так, чтобы они были независимы от программ, которые используют данные, общий и контролируемый подход используется для добавления новых данных и в изменении и выборке данных, существующих в базе данных.

Мартин, Джеймс. Организация компьютерных баз данных, стр. 19
Martin, James. Computer Data-Base Organization. Englewood Cliffs: Prentice-Hall, Inc.,1975:p.19.

Хотя в процессе нормализации структуру базы данных используются пять разных фаз, только первые три выполняются достаточно часто, оставшиеся две полезны в редких случаях. Нормализация основана на концепции хранения данных в массивах. Каждый столбец массива содержит атрибут моделируемого класса объекта, называемым "классом сущности". Каждая строка представляет собой различный случай объекта, также называемым "сущностью", которая может быть уникально определена 'первичным ключом'.

Первая нормальная форма

Атрибуты, имеющие повторяющие значения для той же сущности индивидуально разделяются и помещаются в один и тот же массив. Первичный ключ увеличен так, что каждая новая строка имеет уникальный идентификатор. Например, предположите, что классом сущности являются дети и каждому ребенку соответствует множество событий иммунизации. В списке ниже идентификатор ребенка помечен звездочкой (*), чтобы показать, что это первичный ключ этого классасущности.

child identifier*,
child name,
child date of birth,
immunization date (1),
immunization type (1),
immunization description (1),
physician's number (1),
physician's name (1),
immunization date (2),
immunization type (2),
immunization description (2),
physician's number (2),
physician's name (2),
...

 

Изменение отражается на сущности класса иммунизации ребенка так, что каждая иммунизация представлена строкой, которую получает каждый ребенок. Хотя теперь строки короче, в массиве строк стало больше.

child identifier*,
child name,
child date of birth,
immunization date*,
immunization type*,
immunization description

 

Вторая нормальная форма

Атрибуты массива, идентифицированные только одной компонентой многокомпонентного первичного ключа переносятся в собственный массив. Создается связь между этими сущностями в новом и существующеммассивах. В примере выше имя ребенка и дата рождения определяются идентификатором ребенка, но не датой или типом иммунизации. Сходным образом описание иммунизации идентифицируется типом иммунизации.

child identifier*,
child name,
child date of birth

immunization type*,
immunization description

child identifier*,
immunization date*,
immunization type*,
physician's number,
physician's name

Третья нормальная форма

Атрибуты, уникально определенные при помощи других атрибутов, помещаются в собственный массив. Создается связь между этими сущностями в новых и существующих массивах.

child identifier*,
child name,
child date of birth,

immunization type*,
immunization description

child identifier*,
immunization date*,
immunization type*,
physician's number

physician's number*,
physician's name

Процедура нормализации подразделила оригинальный объект иммунизации детей начетыре связанных подобъекта. Тем не менее эти объекты легче обрабатывать и в них нет возможности дублирования данных. Подобъекты имеют законные лица, они являются детьми, типами иммунизаций, врачами и событиями иммунизации.

 

Системы управления базами данных

База данных может быть определена как набор взаимосвязанных данных, хранящихся вместе без вредной или не необходимой избыточности, для обслуживания одной или более прикладных программ оптимальнымпутем, данные хранятся так, чтобы они были независимы от программ, которые используют данные, общий и контролируемый подход используется для добавления новых данных и в изменении и выборке данных, существующих в базе данных.

Мартин, Джеймс. Организация компьютерных баз данных, стр. 19
Martin, James. Computer Data-Base Organization. Englewood Cliffs: Prentice-Hall, Inc.,1975:p.19.


Рисунок V-1 - Модель ANSI/SPARC
 

Система управления базамиданных (СУБД) используется для достижения независимости данных от прикладных программ. Как было сказано в главе III, "системы управления базами данных (СУБД) – это структурированный набор данных и программ управления этими данными". Для того чтобы сделать это СУБД манипулирует данными и мета данными, хранящимися в файлах. Она используетмета данные чтобы структурировать данные в соответствие с объектами и связями. Затем, она представляет и форматирует результаты в соответствиес запросом прикладной программы. На рисунке V-1 схематическая модель ANSI/SPARC показывает как СУБД достигает независимости при помощи трех функциональных уровней.

Низший уровень выбирает данные из файловой системы и манипулирует ими. Средний уровень структурирует данные концептуально в соответствии с метаданными. Верхний уровень, основываясь на концептуальной структуре, представляет данные в формате, требуемом для прикладной программы.

 

Жизненный цикл базы данных

Базы данных, так же как дороги и строения, должны быть спланированы, спроектированы, построены и поддержаны. Кроме того, также как ис дорогами и строениями, сначала должна быть проведена оценка для определения действительно ли база данных полностью приемлема. Иногда простые,недорогие средства хранения данных, такие как рабочие листы или даже текстовые документы достаточны.

База данных должна использоваться, если существует любое из следующих условий:

Имеется большое количество данных с многими типами записей, встречающихся много раз.

Структура данных сложна и включает множество связей между пунктами данных.

Есть много различных требований пользователей, использующих данные.

Есть потребность приспособиться ко многим будущим изменениям.

На рисунке V-2 показаны восемь стадий жизненного цикла базы данных. Путь является циклом, который подразумевает, что он может быть повторен множество раз за время жизни базы данных.


Рисунок V-2 - Жизненный цикл базы данных
 

Планирование

Определение здоровья и целей и задач здравоохранения – это то, для поддержки чего предназначенаинформационная система. На этой стадии все заинтересованные в информационной системе стороны дают обязательства поддержатьпоследующее развитие. Проекту должны быть выделены финансовые ресурсы.Определены действия и необходимые ресурсы, например, персонал.

Анализ

Определение информации,требуемой для достижения целей и задач здравоохранения. Приобретаютсязнания о данных, необходимых для удовлетворения информационных нужд, ихпроизводителях, потоках, периодах времени и обработке.

Спецификация

Определение ресурсов (техническое обеспечение, программное обеспечение, люди), требующихся разработки и установки системы, а также для подготовки пользователей. Спецификация должна включать рассмотрение защиты и конфиденциальности данных.

Проект
Концептуальный проект базы данных, которая поддерживает сбор, хранение и обработку данных. Проект должен включать в себя условия интерфейса с другими базами данных, прикладными программами, ручными процедурами и инфраструктуру, т.е. платформу и архитектуру сети.

Разработка

Ввод мета данных, внутренней концептуальной и внешней схем, программирование внутренних функций и рутинны СУБД, программирование процедур построения иподдержки базы данных.

Тестирование

Сверка работы СУБД с проектом базы данных и подтверждение концептуального проекта базы данных относительно целей и задач здравоохранения.

Внедрение

Установка СУБД и ее базы данных с соответствующими обучением пользователя и работой.

Эксплуатация

Продолжающееся использование СУБД и продолжающаяся поддержка базы данных. Эта стадия требует постоянного пересмотра концептуального проекта для адаптации к изменениям или новым требованиям (которые могут привести к новому жизненному циклу), рост базы данных контролируется, инфраструктура информационной системы здравоохранения управляется, безопасность и конфиденциальность данных проверяются и изменяются, чтобы противостоять риску.


© 2005 Канадское общество международного здравоохранения и авторы
Документ доступен на: www.csih.org