Студопедия

Главная страница Случайная лекция


Мы поможем в написании ваших работ!

Порталы:

БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика



Мы поможем в написании ваших работ!




СИСТЕМА CensSys

Эта система разработана для такого типа структурированных источников, как переписи, Я. Олдерволлом (Бергенский университет, Норвегия). CensSys в определенном смысле является системой управления базами данных. Не обладая гибкостью реляционной СУБД или сложной иерархической структурой (у нее всего два уровня иерархии), CensSys, однако, имеет существенные достоинства, самым важным из которых является возможность редуцирования (сжатия) информации, т.е. возможность сведения множества встречающихся в источнике вариантов одного и того же понятия к нескольким более крупным категориям. В отличие от стандартных СУБД, в CensSys эта проблема решается, причем исходная информация также остается доступной в процессе работы. При поиске данных в CensSys, чтобы избежать потери информации из-за различия в написании одних и тех же слов, можно просто указывать нужные варианты исходных данных, не перечисляя всех разночтений в многократно повторяющихся запросах. Особенно важно, что CensSys может смешивать в одной и той же переменной данные разных типов, например, записывать в поле переменной "возраст" как числовое значение, так и текст, сохраняя при этом возможность вычисления среднего возраста. Благодаря указанным особенностям, скорость работы CensSys много выше, чем у стандартных субд.

Кроме свойств СУБД, система обладает свойствами и несложного статистического пакета и в этом качестве также отличается высокой скоростью работы; это очень важно для больших баз данных, которые обычно создаются по материалам переписей. Построенная в CensSys таблица существует в т.н. активной форме, т.е. остается связанной с данными: нажатие одной клавиши позволяет переходить от сводной таблицы к исходной информации. Более того, таблицы можно дробить по любой переменной, переходя таким образом к многомерным таблицам; общее число активных таблиц может достигать 255.

Таким образом, достоинствами системы CensSys являются скорость, удобный поиск, возможность сжатия информации и гибкость в работе с таблицами. Кроме того, система проста и удобна в использовании и имеет хороший интерфейс (меню, контекстная помощь и встроенный текстовый редактор).

Разумеется, CensSys имеет и ограничения. К ним относятся только два уровня иерархии по 50 переменных на каждом уровне, имеющих максимум по 255 значений. Максимальная длина поля -255 символов; максимальное число объектов - 32767. Важнее всего, однако, то, что структура CensSys является чересчур жесткой, т.е. она не может изменяться после создания базы, объекты в процессе работы нельзя добавлять или удалять, наконец, одну базу нельзя связывать с другою.

Для работы в Windows Я. Олдерволлом создана модификация этой системы - Wincens (Windows CensSys) на основе Windows. Wincens работает с массивом "атомов", где термин "атом" обозначает любой элемент данных, любую информацию, которая может храниться в памяти компьютера: число, слово, законченный текст, карту, фотографию или даже базу данных. Каждый вид атомов должен иметь, по крайней мере, один способ представления (визуализации): это может быть вывод информации на экран, а для данных, имеющих сложный формат, - вызов соответствующего текстового или графического (карты, изображения) редактора.

Сильной стороной системы является возможность смешивать данные разных типов по той причине, что исходные данные не используются в системе непосредственно - база данных состоит из целых чисел и только из них. Эти числа - не что иное, как коды, символические обозначения "атомов" и их списков. Такая концепция позволяет системе работать с очень высокой скоростью, анализируя очень сложные данные различных типов в форме закодированной информации.

Объекты базы обладают определенными свойствами, т.е. наборами элементарных данных; объекты, имеющие определенные наборы свойств-атрибутов, объединяются в группы, которые, в свою очередь, разбиваются на подгруппы или объединяются в супергруппы. Каждая группа имеет номер, имя, список атрибутов и список значений этих атрибутов, а также список "представлений", т.е. способов репрезентации или обработки этой группы. Количество атрибутов группы и количество вариантов каждого атрибута не ограничены, при этом группа содержит не сами атрибуты, а просто их списки и в такой форме занимает очень мало места в памяти компьютера. Таким образом, Wincens строит базу данных из трех частей:

• множества групп;

• множества атрибутов, состоящего из списка кодов, указывающих на массив "атомов";

• массива "атомов", которые могут содержать информацию любого типа, в том числе быть списками других "атомов".

Wincens не поддерживает стандартную концепцию иерархической модели данных, используя более нейтральное понятие "связи": так, человек может быть связан с домохозяйством, домохозяйство - с домом, дом - с церковным приходом и т.д.. При этом иерархическая система устанавливается de facto. Эти же связи можно организовать иным образом: например, домохозяйство - с проживающими в доме людьми и т.д. Таким образом, каждый человек может быть частью нескольких иерархических систем или находиться на разных уровнях в одной системе; можно даже представить ситуацию, когда один и тот же человек одновременно находится на высшем и низшем уровнях какой-то иерархии, и такую систему слишком трудно формализовать в виде схемы. Wincens может использоваться для создания как иерархических, так и реляционных баз данных, используя сильные стороны обеих моделей.

В Wincens существуют три вида связей: группа-сущность, сущность-сущность и группа-группа. Каждая связь - это тоже некоторый "атом", описывающий тип связи и связываемые группы. Тип связи можно задавать в свободной словесной форме: например, связь типа "живущий в..." или "являющийся сыном (дочерью)..." и т.п. У каждой сущности может быть несколько "выходящих" или "входящих" связей, причем в случае связанных групп у обоих групп должны быть соответствующие атрибуты связей. Связывание групп в Wincens происходит гораздо быстрее, чем в реляционных базах данных, т.к. вместо поиска совпадающих значений ключевых полей используются прямые связи. Это позволяет связывать друг с другом любое число разных групп, принадлежащих одному и тому же множеству, что невозможно в реляционной СУБД.

По принципу хранения информации Wincens - свободная база данных, т.е. это база, в которой отдельно хранится структура и отдельно - содержимое в виде свободного текста. Благодаря этому принципу Wincens может эффективно работать и с текстовыми базами данных. Для представления информации о группе требуется выбрать атрибуты и их варианты. Если какие-то из атрибутов являются связями, можно включить в представление атрибуты группы, связанной с данной, в том же окне экрана, что исходная группа, или в другом, образуя т.н. связанный набор окон.

Специальное представление создается и для анализа, например, для таблицы сопряженности конструируется представление, состоящее из атрибутов, сопряженность которых вас интересует, при этом нужные атрибуты просто выбираются из предлагаемого системой списка. Идея представления информации позволяет не только конструировать нужный вам формат экрана, но и уменьшать количество "активной" информации, оперируя на каждом шаге только необходимыми данными и не обращаясь к остальным.

Wincens строится по модульному принципу, при котором отдельные программы "отвечают" за отдельные функции системы, Все эти программы должны иметь доступ к данным с помощью т.н. DDL {Dynamic Data Library - динамической библиотеки данных). В этой библиотеке будут три "хранителя" ресурсов: один для множества групп, другой - для набора атрибутов и третий для массива "атомов". Кроме того, система рационально использует уже имеющееся стандартное программное обеспечение, например, текстовый процессор. То же самое относится к электронным таблицам, графическим пакетам и картографическим системам.


<== предыдущая страница | следующая страница ==>
ПРОГРАММА QualiDatE | СИСТЕМА SOCRATES

Дата добавления: 2014-12-09; просмотров: 319; Нарушение авторских прав




Мы поможем в написании ваших работ!
lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.004 сек.