Предисловие
Данная лабораторная работа позволяет освоить базовые методы исследования взаимосвязей в электронной таблице — корреляционный и регрессионный анализ.
При выполнении лабораторной работы используются знания и навыки, полученные на предыдущих занятиях.
Условные обозначения:
— жирный шрифт — названия функций и пунктов меню;
— КНОПКИ на экране компьютера;
— КЛАВИШИ на клавиатуре компьютера.
Описывается работа в англоязычной версии Microsoft Excel из пакета Office 365. В тексте приводятся названия пунктов меню и функций на английском и на русском языках. На рисунках используется английская версия пакета.
Введение
В данной лабораторной работе рассматривается корреляционная зависимость, или корреляция [1–4].
В работе для изучения взаимосвязи используются методы корреляционного и регрессионного анализа, а также сводка и группировка данных. Работа выполняется в пакете Excel [5].
Корреляционный анализ позволяет оценить степень тесноты связи. Регрессионный анализ используется для построения линейных и нелинейных моделей.
На первом этапе исходные данные получают путём имитационного моделирования. На втором этапе проводится анализ реальных данных.
Требования к оформлению отчёта приведены в описании предыдущей лабораторной работы [6].
Общие сведения
Корреляция — это связь между двумя случайными величинами, которые часто называют следующим образом:
X — факторный признак;
Y — результативный признак.
Изображение исходных данных называется диаграммой разброса. Каждая пара чисел X и Y изображается отдельной точкой. Точки между собой не соединяют.
Пример диаграммы разброса для корреляционной зависимости показан на рисунке ниже.
Варианты задания
Варианты заданий представлены в таблицах.
В каждом варианте рассматриваются два набора данных — примеры линейной и нелинейной регрессии. Анализ проводится для обоих случаев.
Факторный признак Х — случайная величина с равномерным распределением.
Случайная составляющая Е — случайная величина со стандартным нормальным распределением (нулевое среднее и единичная дисперсия).
Результативный признак Y вычисляется по формуле.
Объём выборки n = 200.
На новом листе опишите вариант задания.
Зарисовки функций
Сделайте зарисовки общей формы зависимости и диаграммы разброса на бумаге. Вставьте зарисовку в отчёт.
Для построения линейной функции оцените значения на границах диапазона значений факторного признака. Оцените случайный разброс по правилу трёх сигм.
Для зарисовки графика параболы дополнительно определите координаты её вершины кривой и направление ветвей.
Выберите масштаб так, чтобы данные занимали всё поле графика. Метки на осях должны быть круглыми числами.
Исходные данные
Сгенерируйте исходные данные в соответствии c вариантом задания.
Вызовите надстройку:
Data Analysis
Анализ данных.
Используйте функцию:
Random Number Generation
Генерация случайных чисел.
Округлите сгенерированные числа до целых.
Задавайте разные начальные состояния генератора для получения фактора Х и случайной составляющей Е.
Для округления используйте функцию
ROUND (number, num_digits)
ОКРУГЛ (число; число разрядов).
Для округления до целых укажите нулевое число разрядов после запятой.
В отчёте опишите параметры генератора случайных чисел.
В дальнейшей работе используйте округлённые значения Х и Y.
Диаграмма разброса
Постройте диаграмму разброса:
Insert — Charts — Insert Scatter (X, Y) or Bubble Chart — Scatter — Scatter
Вставка — Диаграммы — Вставить точечную (X, Y) или пузырьковую диаграмму — Точечная — Точечная.
Настройте оформление графика. Задайте масштаб и информативные заголовки. Пример оформления показан на рисунке.
В отчёте опишите внешний вид графиков.
Корреляционный анализ
Корреляционный анализ — это изучение степени тесноты связи.
Коэффициент линейной корреляции — это показатель степени линейной связи и разброса точек вокруг прямой линии. Знак коэффициента говорит о направлении связи, а величина коэффициента — о степени тесноты линейной зависимости.
Для вычисления коэффициента корреляции используйте следующие способы:
— надстройка Анализ данных;
— готовая функция CORREL;
— формулы, вводимые вручную.
Надстройка
Вызовите надстройку Анализ данных и выберите модуль Корреляция.
Задайте диапазоны исходных данных и укажите, что они расположены по столбцам:
Grouped By — Columns
Группирование — по столбцам.
С помощью надстройки получите таблицу коэффициентов линейной корреляции. Настройте ширину столбца, чтобы увеличить точность представления результата.
Опишите в отчёте полученные результаты.
Функция CORREL
Вычислите коэффициент корреляции с помощью следующей функции:
CORREL (array1, array2)
КОРРЕЛ (диапазон_x; диапазон_y).
В качестве аргументов функции укажите диапазоны ячеек факторного и результативного признаков.
Изучите внешний вид диаграмм разброса в зависимости от коэффициента корреляции. Для этого на новом листе сгенерируйте наборы данных и подберите значения множителя S в уравнении, чтобы получить следующие значения коэффициента корреляции:
0,3
0,5
0,7
1,0.
Постройте диаграммы разброса. Укажите на них значения коэффициента корреляции и степень тесноты связи.
Формулы
Бесплатный фрагмент закончился.
Купите книгу, чтобы продолжить чтение.