Студопедия

Главная страница Случайная лекция


Мы поможем в написании ваших работ!

Порталы:

БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика



Мы поможем в написании ваших работ!




Тема 3 Технологии оперативного и интеллектуального анализа данных

Читайте также:
  1. I ОСОБЕННОСТИ ВЫБОРА И АНАЛИЗА ПОСТАНОВОЧНОГО МАТЕРИАЛА В КОЛЛЕКТИВЕ.
  2. I. ОПРЕДЕЛЕНИЕ БИОТЕХНОЛОГИИ КАК НАУКИ И ЕЕ ПРЕДМЕТА ИЗУЧЕНИЯ.
  3. I. Создание баз данных
  4. III. КРАТКАЯ ИСТОРИЯ РАЗВИТИЯ БИОТЕХНОЛОГИИ.
  5. Internet-технологии в бизнесе
  6. IV. СОВРЕМЕННЫЕ ЗАДАЧИ И ПЕРСПЕКТИВЫ РАЗВИТИЯ БИОТЕХНОЛОГИИ.
  7. Microsoft Excel. Работа с пакетом анализа. Построение простой регрессии
  8. OLAP-технологии
  9. PR-технологии в привлечении инвестиций. Спонсоринг и фандрайзинг
  10. Автоматическая проверка типа данных

Контрольные вопросы

1. Какие этапы прохождения данных от первичных источников к пользователям Вы знаете?

2. В чем состоит идея гибкой архитектуры данных?

3. Назовите свойства открытых систем.

4. Каково содержание свойств расширяемости и масштабируемости?

5. Каково содержание свойств переносимости и интероперабельности?

6. Каково содержание свойств способность к интеграции и высокой готовности?

7. Чем определяется значение стандартов при создании и применении ИАС?

8. Какие стандарты описания показателей Вы знаете?

9. В чем смысл стандартов электронного обмена данными?

10. Какие проблемы разрешаются ETL-процессами?

11. Назовите стадии ETL-процессов.

12. Какие аспекты характеризуют сбор данных?

13. Каковы требования к качеству данных, помещаемых в ИХ?

14. Какие методы повышения качества данных используются в процессе их продвижения в информационное хранилище?

15. Какие проблемы решаются при приведении данных к единому формату информационного хранилища?

16. В чем состоит смысл семантического разрыва?

17. Какие виды семантических разрывов Вы знаете?

18. Какие источники данных для информационного хранилища Вы можете назвать?

19. Назовите основные принципы построения информационных хранилищ —правила Инмона.

20. В чем заключаются требования предметной ориентированности?

21. Раскройте понятие интегрированности данных в ИХ?

22. В чем состоят требования неизменчивости?

23. В чем состоит поддержка хронологии в информационном хранилище?

24. Какова структура информационного хранилища?

25. Раскройте содержание концепции централизованного хранилища данных.

26. В чем состоит концепция распределенного хранилища данных?

27. Что такое автономные витрины данных?

28. В чем смысл концепции единого интегрированного хранилища и многих витрин данных?

29. Раскройте понятие «база метаданных — репозиторий ИХ».

30. Каковы назначение и выполняемые функции метаданных?

31. Опишите принципы создания репозитория ИХ.

32. Каково назначение и содержание бизнес-метаданных?

33. Для чего нужны технические метаданные?

34. Чем различаются активные и пассивные метаданные?

35. Как делятся данные по стадиям применения?

36. В чем смысл разделения метаданных на активные рабочие и пассивные рабочие МД?

37. Какие компоненты входят в состав трехмерной классификации и модели метаданных?

38. На какие вопросы отвечает размерностная модель метаданных (модель Захмана) информационного хранилища?

39. Что содержат метаданные, описывающие сущности?

40. Каков состав метаданных, отвечающих на вопрос — где?

41. В чем смысл метаданных, отвечающих на вопрос — когда?

42. Какова идея совокупности метаданных, отвечающих на вопрос — кто?

43. Раскройте смысл совокупности метаданных, отвечающих на вопрос — почему?

44. Какие метаданные описывают действия, выполняемые над данными?

45. Раскройте понятие модели данных информационного хранилища.

46. Назовите элементы модели данных информационного хранилища.

47. Что помещается в таблицы фактов?

48. Какие виды фактов Вы знаете?

49. Что представляют собой таблицы размерности?

50. Каково назначение консольных таблиц?

51. Перечислите виды многомерных схем данных и дайте им краткую характеристику.

52. В чем смысл схемы «звезда»?

53. В чем смысл схемы «снежинка»?

54. В чем смысл схемы «созвездие»?

55. Каковы особенности многомерных моделей данных?

56. Какие принципы положены в основу построения модели данных ИХ?

 

Тестовое задание

1. Идея гибкой архитектуры данных означает, что:

1. архитектура данных в информационно-аналитической системе может быть легко изменена;

2. любому пользователю из числа доверенных лиц должна быть обеспечена возможность доступа к любому разрешенному для использования участку данных, которыми располагает предприятие (организация).

 

2. Открытая система согласно определению POSIX 1003.0 принятому Комитетом IEEE это:

1. обладающая специальными свойствами система, позволяющая пользователям переходить от системы к системе с переносом данных и программных приложений;

2. система, открытая любому пользователю.

 

3. Выделите из приведенных свойств систем необязательные для открытых систем свойства:

1. расширяемость;

2. минимальное время отклика;

3. масштабируемость;

4. многомерность;

5. переносимость;

6. поддержка хронологии;

7. интероперабельность;

8. способность к интеграции;

9. высокая готовность.

 

4. ETL (Extraction, Transformation, Loading)-процессы сбора, преобразования и загрузки данных обеспечивают:

1. подготовку результатов анализа;

2. создание массива данных в информационном хранилище.

 

5. Сбор данных характеризуют следующие аспекты:

1. формализованный;

2. структурный;

3. смысловой.

 

6. В процессе продвижения данных в информационное хранилище используются следующие критерии оценки качества данных по структурному представлению:

1. по критичности ошибок в данных — ошибки в именах полей, типах данных;

2. по правильности форматов и представлений данных;

3. на соответствие ограничениям целостности;

4. на кроссязыковый разрыв;

5. уникальности внутренних и внешних ключей;

6. по полноте данных и связей.

 

7. Нарушения смыслового содержания данных (семантические разрывы) бывают следующих видов:

1. «вавилонский»;

2. кросспотоковый разрыв;

3. разрыв кодограмм;

4. кроссязыковый разрыв;

5. асинхронный разрыв.

 

8. Основные принципы построения информационных хранилищ — правила Инмона следующие:

1. предметная ориентированность;

2. многомерность;

3. интегрированность;

4. неизменчивость;

5. поддержка хронологии.

 

9. Структура информационного хранилища содержит следующие функциональные модули:

1. зона накопления данных;

2. зона хранения данных;

3. блок анализа;

4. зона хранения данных в многомерном (объектном) виде.

 

10. Концепция информационного хранилища может быть реализована в нескольких вариантах:

1. централизованное хранилище данных;

2. распределенное хранилище данных;

3. корпоративное хранилище данных;

4. автономные витрины данных;

5. единое интегрированное хранилище и многие витрины данных.

Найдите неточный определение варианта концепции.

 

11. База метаданных или репозиторий информационного хранилища представляет собой…

 

12. Различают следующие основные виды метаданных:

1. бизнес-метаданные;

2. обзорные метаданные;

3. технические метаданные.

Найдите правильно сформулированные виды метаданных

 

13. Используются следующие модели метаданных:

1. трехмерная;

2. четырехмерная;

3. шестимерная.

 

14. Модель данных информационного хранилища содержит следующие элементы:

1. таблица факта;

2. таблицы связей;

3. таблицы размерности (измерений);

4. консольные таблицы.

Определите лишний элемент.

 

15. Многомерные схемы данных в информационно-аналитической системе бывают следующих видов:

1. схема «звезда»;

2. схема «снежинка»;

3. схема «капля»;

4. схема «созвездие».

 

 

3.1 Подходы к выполнению анализа средствами информационных технологий (IT-анализа)

Информация, извлекаемая из информационных хранилищ и предоставляемая ее конечным потребителям независимо от архитектуры ИХ, способов представления в базах данных, должна отвечать предъявляемым требованиям по форме представления, содержанию, своевременности, достоверности, воспринимаемости и т.д. Применяемые методы анализа должны обеспечивать необходимое содержание и достоверность предоставляемой пользователям информации.

Классификация IT-анализа по режиму и темпу

Различают два вида информационно-аналитических систем по режиму и темпу анализа:

− статические — имеют заранее разработанный сценарий обработки данных при весьма ограниченных возможностях вариаций запросов — так называемые информационные системы руководителя (Exequtive Information system EIS);

− динамические — обеспечивают обработку нерегламентированных запросов и гибкую систему подготовки отчетов.

Статические ИАС при всей кажущейся простоте и соответственно привлекательности для ЛПР имеют ограниченные возможности по информационной поддержке принятия решений. Зачастую полученная в отчетах информация порождает вытекающие из ее содержания вопросы, на которые в допустимое время ответ не может быть получен.

Динамические ИАС предназначены для обработки незапланированных заранее, неожиданных (ad hoc) запросов. Пользователи системы работают с такой ИАС в интерактивном режиме. Обрабатывается серия непредусмотренных заранее запросов, которые возникают в ходе полготовки и принятия решения. Заранее может быть подготовлена некоторая цепочка

действий или сценарий, который может корректироваться.

Поддержка принятия управленческих решений осуществляется в следующих режимах или базовых сферах:

– сфера детализированных данных;

– сфера агрегированных показателей;

– сфера закономерностей.

В сфере детализированных данных подсистемы ИАС или автономные ИС нацелены на поиск данных. Эту задачу отлично выполняют реляционные СУБД. В качестве языка манипулирования данными, ставшего стандартным, используется, как правило, SQL. Для поиска детализированной информации используются информационно-поисковые системы, которые могут работать с операционными, локальными или региональными базами и хранилищами данных, а также и совместно с центральным ИХ.

Сфера агрегированных показателей отличается агрегацией данных, оперативной аналитической обработкой, многомерным представлением в виде гиперкубов, многомерным анализом. В этой сфере используются специальные многомерные СУБД. Допустимо использование реляционных представлений данных. При правильном применении реляционных СУБД, показатели эффективности ИАС сопоставимы со специализированными многомерными. Агрегированные массивы при реляционном подходе представлены в виде описанных выше схем: «звезды» и других. Агрегация может производиться также «на лету» при обработке запроса.

Анализ детализированных данных и агрегированных показателей относится к оперативному или OLAP-анализу.

Сфера закономерностей связана или основана на интеллектуальной обработке данных. Главной задачей здесь выступает выявление закономерностей в исследуемых процессах, взаимосвязей и взаимовлияния различных факторов, поиск крупных «непривычных» отклонений, прогноз хода различных существенных процессов. Эта сфера относится к интеллектуальному анализу (Data mining).


<== предыдущая страница | следующая страница ==>
Модели данных информационного хранилища | Требования, предъявляемые к OLAP-системам

Дата добавления: 2014-02-26; просмотров: 951; Нарушение авторских прав




Мы поможем в написании ваших работ!
lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.004 сек.