электронная
72
печатная A5
353
12+
Информационные технологии в управлении

Бесплатный фрагмент - Информационные технологии в управлении

Аналитическая платформа Deductor. Учебное пособие по проведению практических занятий со студентами управленческих направлений подготовки

Объем:
158 стр.
Возрастное ограничение:
12+
ISBN:
978-5-4490-1257-9
электронная
от 72
печатная A5
от 353

Введение

В данном пособии приводятся примеры использования аналитической платформы «Deductor». Рассматриваются некоторые возможные реализации нейронных сетей, кластеризация с помощью карт Кохонена, прогнозирование временных рядов и создание баз знаний.

Наличие достаточно развитых инструментальных программных средств аналитической платформы «Deductor» позволяет аналитику при построении модели прогнозируемого процесса руководствоваться такими понятиями, как опыт и интуиция. В ряде случаев, когда нет необходимости в строгой математической спецификации модели, такой подход представляется вполне допустимым, что особенно ценно при анализе плохо формализуемых процессов.

Изучение пособия дает возможность студентам бакалавриата и магистратуры существенно продвинуться в освоении совокупности методов и средств аналитической обработки информации.

Пособие предназначено для студентов факультета государственного управления МГУ, а также студентов гуманитарных специальностей, изучающих информационные технологии в управлении.

Хочу выразить свою благодарность доценту Кафедры математических методов и информационных технологий Факультета государственного управления МГУ И.А.Смольниковой за оказанную помощь и полезные советы при редактировании этой книги.

Если у Вас возникнут вопросы, то пишите мне dudikhin@yandex.ru

I. Аналитическая платформа Deductor

Аналитическая платформа платформа Deductor — это отечественный программный продукт, разработанный компанией BaseGroup Labs. С его помощью возможно решение самого широкого спектра задач, начиная от создания систем корпоративной отчетности и до решения задач Data Mining.

Это специализированное программное решение выполнено на базе единой платформы и содержит в себе необходимые инструменты для извлечения закономерностей из «сырых» данных. Оно позволяет пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.

Система позволяет анализировать любые табличные данные и для решения аналитических задач. В ней предусмотрена возможность использования следующих специальных технологий:

— Data Warehouse (хранилища данных) — консолидация данных и обеспечение быстрого и понятного для аналитика доступа к ним

— OLAP (многомерный анализ) — визуализация, отчетность и удобное манипулирование большими объемами данных

— Data Mining (моделирование, интеллектуальный анализ данных) — поиск скрытых закономерностей, выявление причинно-следственных связей, анализ рисков

— KDD — Knowledge Discovery in Databases (обнаружение, извлечение знаний) — построение сценариев обработки от очистки и предобработки данных до моделирования.

В настоящем пособии рассматриваются только некоторые технологии из приведенного списка.

Последовательность действий (импорт, экспорт, обработка, визуализация) при решении конкретных задач в Deductor задается сценарием обработки. Сами же сценарии формируются специальным приложением Deductor Studio, которое является рабочим местом аналитика.

В профессиональной версии системы для импорта и анализа пригодны разнообразные табличные данные из стороннего источника (Oracle, MS SQL, Sybase, MS Access, Excel, 1С и др.). В учебной версии Deductor Academic — импортируются только данные в формате текстовых файлов с разделителями в виде табуляции.

Под обработкой данных в системе подразумевается любые действия, связанные с их преобразованием, такие как очистка данных, их трансформация и построение разнообразных моделей Data Mining.

При визуализации производится отображение полученных и обработанных данных. Аналитическая платформа самостоятельно анализирует формат отображения, предоставляя пользователю возможность выбора необходимого варианта.

В профессиональной версии системы предусмотрен экспорт (вывод) результатов обработки в виде файлов для последующего использования. В учебной версии Deductor Academic данная опция отсутствует.

В платформе Deductor представлено большинство основных технологий анализа, позволяющих достаточно быстро проектировать законченные аналитические решения, охватывающие весь цикл обработки данных. Это — многомерный анализ, нейронные сети, деревья решений, самоорганизующиеся карты, спектральный анализ и ряд других.

Применение подобных самообучающиеся методов и машинного обучения дает возможность создавать адаптивные информационные системы. Во многом такой подход делает более мягкими требования к квалификации персонала, приближая современные информационные технологии к более широкому кругу пользователей.

С помощью аналитической платформой Deductor появляется возможность извлекать из ранее накопленных и хранящихся в организации (в компании, в фирме, в департаменте государственного учреждения и др.) данные, интересную и практически полезную информацию, и тем самым трансформировать ее в знания, дающие существенные конкурентные преимущества.

Тиражирование же знаний обеспечивается за счет того, что все отчеты, модели, правила, полученные экспертом с помощью аналитической платформы Deductor, могут использоваться другими сотрудниками организации без необходимости понимания способов и методов получения этих результатов.


ЛИТЕРАТУРА К РАЗДЕЛУ I

— Deductor Integration Server — Руководство по установке и настройке Deductor Компания BaseGroup™ Labs

— Руководство администратора Deductor 5.3 Компания BaseGroup™ Labs

— Практикум Базовые навыки работы в Deductor Studio BaseGroup™ Labs, 2009

— Н. Ю. Прокопенко ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ АНАЛИЗА ДАННЫХ (аналитические информационные системы поддержки принятия решений на базе Deductor Studio Academic 5.2) Учебное пособие. Нижний Новгород2012.

II. Нейронные сети и их использование

Целью данной практической работы является ознакомление с примерами использования нейронных сетей для решения практических задач. Для выполнения работы используется свободно распространяемая аналитическая программная платформа «Deductor Academic» и программа работы с электронными таблицами MS Excel.

Нейронный сети — это большой класс информационных систем, построение которых имеет некоторую аналогию с структурой нервной ткани человеческого мозга. Нейросетевые технологии функционируют аналогично неосознанным мыслительным действиям человека. Нейронные сети в искусственном интеллекте — это упрощенные модели биологических нейронных сетей.

Известно, что нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Нейрон является особой биологической клеткой, которая обрабатывает информацию. Элементарным преобразователем в искусственных нейронных сетях является искусственный нейрон, названный так по аналогии с биологическим прототипом.

Принципиальное отличие искусственных нейросетей от обычных программных систем состоит в том, что первые не требуют программирования и их можно обучить тому, что требуется пользователю.

Одна из наиболее распространенных архитектур нейронных сетей персептрон. Он построен по принципу иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов предыдущего слоя.

Для нейросетевой модели обработки данных характерно следующее:

— однородность системы (элементы нейронной сети одинаковы и просты, все определяется структурой связи)

— надёжность системы, построенной из ненадёжных элементов, за счёт избыточного числа связей

— «голографичность», предопределяющая, что при разрушении части система сохраняет свои свойства.

Структура искусственного нейрона и нейронной сети

Схема искусственного нейрона представлена на рис. А. Сумматор выполняет сложение сигналов Хi, поступающих по синаптическим связям от других нейронов, а также внешних входных сигналов. Синапсы осуществляют связь между нейронами, умножают входной сигнал Хi на число Wi, характеризующее силу связи между нейронами.

Нелинейный преобразователь f реализует нелинейную функцию преобразования значение выхода сумматора, согласно функции активации (передаточной функции) нейрона. Структура искусственного нейрона представлена ниже

Данный вычислительный элемент — это весьма упрощенной математической моделью биологических нейронов. Поэтому подобные структуры иногда называют нейроноподобными элементами или формальными нейронами.

Примеры функций активации (нелинейных преобразователей) используемых в аналитической платформе Decuctor приведены ниже. Здесь a — параметр наклона функции активации, e — основание натуральных логарифмов

— — логистическая функция (она же сигмоид) f (х) = 1 / (1+e-aх)

— — гиперболический тангенс th (x)

f (x) = (eax — e-ax) / (eax + e-ax)

— — арктангенс f (x) = arctg (x)

В основу концепции нейронных сетей положена идея коннекционизма. Согласно ней, нейроны можно моделировать довольно простыми автоматами и свойства нейронной сети определяются связями между нейронами. Каждая связь представляется как простой элемент, служащий для передачи сигнала.

Пример трехслойной нейронной сети, состоящей из десяти нейронов представлен на рисунке ниже

Известна также так называемая теорема о полноте, которая гласит, что любая непрерывная функция на замкнутом ограниченном множестве может быть равномерно приближена функциями, вычисляемыми нейронными сетями, если функция активации нейрона непрерывна и дважды непрерывно дифференцируема. Следовательно, нейронные сети являются универсальными структурами, позволяющими реализовать любой вычислительный алгоритм.

При решении конкретных задач на нейроны самого первого слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д.

Эти значения рассматриваются как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям.

В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ — реакция всей сети на введенные значения входных параметров.

Для того, чтобы нейронная сеть успешно функционировала, ее необходимо обучить, то есть «натренировать» на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Различают обучение нейронных сетей с «учителем» и «без учителя».

Тренировка состоит в подборе весов Wi межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам. Для подбора значений весов межнейронных связей разработаны специальные методы. Например, метод обратного распространения ошибки, являющийся штатной опцией аналитической платформы Deductor.

Технология настройки нейронной сети является последовательной, итерационной процедурой. При конструировании нейронной сети один из наиболее сложных вопросов — определение количества слоев нейронов, количество нейронов в слое и структуру связей между нейронами) адекватное решаемой задаче. В настоящее время эффективные методы для точного решения задач выбора класса, архитектуры и строгая теория построения нейронных сетей, к сожалению, отсутствуют. Однако, это обстоятельство не слишком препятствует исследованию возможности их широкого применения

.

Литература к разделу II

— Ясницкий Л. Н. Интеллектуальные системы: учебник. М: Лаборатория знаний, 2016. — 221 с.

— Тадеусевич Р., Боровик Б., Гончаж Т., Леппер Б. Элементарное введение в теорию нейронных сетей с примерами программ / Перевод с польск. И.Д.Рудинского. М: Горячая линия — Телеком, 2011. — 408 с.

— Хайкин С., Нейронные сети. Полный курс. М: Издательство Вильямс, 2006. — 1101 с.

Задание №1
Проектирование нейронной сети для выполнения арифметических операций

Постановка задачи

Спроектировать нейронную сеть для выполнения арифметических операций сложения и умножения двух переменных А и В. Диапазон изменения входных переменных от 0 до 10. В результате выполнения задания должна быть спроектирована нейронная сеть с тремя входами (А, В, вход задания типа выполняемых действий «Операция») и одним выходом R (результат операции), представляющая собой трехслойный персептрон.

0. Формирование исходных данных для построения нейронной сети, реализующей арифметические операции

Модели, реализованные на основе нейронных сетей, обучаемы. В данной работе мы рассмотрим алгоритм «обучение с учителем». При его использовании нейронной сети предъявляются значения как входных, так и желательных выходных сигналов, и она, по некоторому внутреннему алгоритму, подстраивает веса своих синоптических связей. Для реализации процесса обучения необходимо сформировать файл Обучающие данные. txt


Для этого:

0.1 Запустите программу Excel

0.2 Создайте с помощью программы Excel таблицу, состоящую из 5 столбцов и 200 строк.

0.3 Сохраните полученный файл в формате «Текстовые файлы (с разделителями табуляции)» под именем Обучающие данные. txt.

Ввод исходных данных

Исходным числовым массивом для решения этой задачи служит созданный ранее файл Обучающие данные. txt с результатами сложения и умножения. В этом файле в столбцах «А» и «В» представлены операнды, в столбце «Операция» — вид операции (сложение/умножение), а в столбце «R» — результаты выполнения арифметического действия.


1.1. Запустите программу Deductor Studio Academic и создайте новый проект

1.2 Инициируйте «Мастер импорта»

1.3 Укажите импорт данных из текстового файла

Бесплатный фрагмент закончился.
Купите книгу, чтобы продолжить чтение.
электронная
от 72
печатная A5
от 353