Анализ данных эксель

Возможности анализа данных

Установленный пакет обладает большим количеством инструментов, которые позволяют решать достаточно сложные задачи, используя ресурсы персонального компьютера для обработки данных. Рассмотрим некоторые функции подробнее:

  1. Дисперсионный анализ позволяет искать зависимости в массиве данных на основании значимости неких средних значений, при этом может использоваться несколько групп данных. Бывает трех видов: однофакторный, двухфакторный с повторениями и без них.

  1.  Корреляция нужна для отображения зависимости между двумя и более значениями или группами.
  2. Ковариация похожа на корреляцию, однако позволяет построить только линейную зависимость двух случайных величин.
  3. Экспоненциальное сглаживание один из основных приемов сглаживания числовых рядов.
  4. Анализ Фурье позволяет представить сложные математические функции в более простом виде при помощи тригонометрических функций.
  5. Гистограмма обрабатывает данные и подготавливает их для графического отображения в виде прямоугольников с одинаковым интервалом.
  6. Генератор случайных чисел добавляет в отмеченный диапазон ячеек случайные числа.

  1. Регрессия в глобальном смысле есть отход, но с точки зрения математики отображает зависимость одной переменной от других независимых величин.
  2. Выборка – инструмент, который позволяет сделать отбор чисел по определенным параметрам из большого массива данных.

И это далеко не полный перечень инструментов, которые содержит установленный пакет данных.

Линейная регрессия в программе Excel

Внизу, в качестве примера, представлена таблица, в которой указана среднесуточная температура воздуха на улице, и количество покупателей магазина за соответствующий рабочий день. Давайте выясним при помощи регрессионного анализа, как именно погодные условия в виде температуры воздуха могут повлиять на посещаемость торгового заведения.

Общее уравнение регрессии линейного вида выглядит следующим образом: . В этой формуле Y означает переменную, влияние факторов на которую мы пытаемся изучить. В нашем случае, это количество покупателей. Значение x – это различные факторы, влияющие на переменную. Параметры a являются коэффициентами регрессии. То есть, именно они определяют значимость того или иного фактора. Индекс k обозначает общее количество этих самых факторов.

  1. Кликаем по кнопке «Анализ данных». Она размещена во вкладке «Главная» в блоке инструментов «Анализ».

Открывается небольшое окошко. В нём выбираем пункт «Регрессия». Жмем на кнопку «OK».

Открывается окно настроек регрессии. В нём обязательными для заполнения полями являются «Входной интервал Y» и «Входной интервал X». Все остальные настройки можно оставить по умолчанию.

В поле «Входной интервал Y» указываем адрес диапазона ячеек, где расположены переменные данные, влияние факторов на которые мы пытаемся установить. В нашем случае это будут ячейки столбца «Количество покупателей». Адрес можно вписать вручную с клавиатуры, а можно, просто выделить требуемый столбец. Последний вариант намного проще и удобнее.

В поле «Входной интервал X» вводим адрес диапазона ячеек, где находятся данные того фактора, влияние которого на переменную мы хотим установить. Как говорилось выше, нам нужно установить влияние температуры на количество покупателей магазина, а поэтому вводим адрес ячеек в столбце «Температура». Это можно сделать теми же способами, что и в поле «Количество покупателей».

С помощью других настроек можно установить метки, уровень надёжности, константу-ноль, отобразить график нормальной вероятности, и выполнить другие действия. Но, в большинстве случаев, эти настройки изменять не нужно

Единственное на что следует обратить внимание, так это на параметры вывода. По умолчанию вывод результатов анализа осуществляется на другом листе, но переставив переключатель, вы можете установить вывод в указанном диапазоне на том же листе, где расположена таблица с исходными данными, или в отдельной книге, то есть в новом файле. После того, как все настройки установлены, жмем на кнопку «OK»

После того, как все настройки установлены, жмем на кнопку «OK».

Изменение формата ячеек Excel

Довольно нередкая причина того, почему у человека появляется неудача в ходе записи формул, заключается в том, что он неверно выбрал формат ячеек, на какие она ссылается. Так, если в ней поставили формат “текст”, то вместо итогового значения перед нами будет просто показана формула в виде текстовой строки.

Есть случаи, когда формат считается правильно, но отображается неверно. Причина этого явления – также ошибочно выбранный формат. Эта проблема может появиться и сама собой, через глюки в работе программы. Как ни странно, человеческий фактор влияет и на работу компьютера, который не является человеком. Но это уже лирическое отступление.

Конечно, в таком случае следует выставить правильный формат. Для этого нужно следовать таким шагам:

  1. Выделить ячейку и перейти на вкладку “Главная” на ленте. После этого перемещаем курсор мыши в группу “число”. Здесь также есть поле, в котором демонстрируется формат, в данный момент присвоенные ячейке.
  2. Нужно нажать на стрелку вниз возле этого поля. После этого появится список с разными форматами ячеек. Нужно выбрать тот, который соответствует тому, который нужно применять в конкретной формуле. После этого делается клик по выбранному варианту.

Есть еще один инструмент, настройки которого более широки. Чтобы его применить, необходимо выполнять следующую инструкцию:

  1. Определить, нам нужно изменить формат одной ячейки или нескольких. После этого выбираем ту, которая нам подходит (или целый диапазон выделяем), после чего делаем правый клик по ней (ним). Далее ищем в появившемся перечне пункт “Формат ячеек”. Задача может быть существенно упрощена, если пользователь нажмет сочетание Ctrl+1.

После этого появляется диалоговое окно, в котором по умолчанию будет открыта вкладка “Число”

Важно убедиться, что открыта именно она. После этого следует обратить ваш взор на список в левой части окна

Там находится перечень доступных форматов ячеек. Нужно выбрать тот, который подходит в конкретной ситуации и нажать ОК.

Для сохранения полученных изменений необходимо воспользоваться функцией редактирования для каждой ячейки с ошибкой при вводе формулы. После того, как мы найдем тот элемент, который нужен, следует отредактировать с помощью клавиши F2 или выполнения двойного клика по соответствующей ячейке. Также внесение изменений возможно с помощью левого щелчка мыши в строке формул. После внесения всех изменений в документ нужно подтвердить свои действия путем нажатия клавиши Enter.

Что следует делать на практике?

  1. Выделяем ячейку, которая расположена в самом верху диапазона.
  2. Наводим курсор на ее правую нижнюю часть (то есть, на угол), убеждаемся в том, что появился знак плюса черного цвета, нажимаем левую кнопку, зажимаем ее и перемещаем курсор до того места, где должен закончиться этот диапазон.

После выполнения этих операций перед нашим взором стоит готовый столбец, который был сгенерирован почти без нашего участия.

Дополнительные сведения

Вы всегда можете задать вопрос специалисту Excel Tech Community, попросить помощи в сообществе Answers community, а также предложить новую функцию или улучшение на веб-сайте Excel User Voice.

Microsoft Excel является одним из самых незаменимых программных продуктов. Эксель имеет столь широкие функциональные возможности, что без преувеличения находит применение абсолютно в любой сфере. Обладая навыками работы в этой программе, вы сможете легко решать очень широкий спектр задач. Microsoft Excel часто используется для проведения инженерного либо статистического анализа. В программе предусмотрена возможность установки специальной настройки, которая значительным образом поможет облегчить выполнение задачи и сэкономить время. В этой статье поговорим о том, как включить анализ данных в Excel, что он в себя включает и как им пользоваться. Давайте же начнём. Поехали!

Для начала работы нужно активировать дополнительный пакет анализа

Первое, с чего нужно начать — установить надстройку. Весь процесс рассмотрим на примере версии Microsoft Excel 2010. Делается это следующим образом. Перейдите на вкладку «Файл» и нажмите «Параметры», затем выберите раздел «Надстройки». Далее, отыщите «Надстройки Excel» и кликните по кнопке «Перейти». В открывшемся окне доступных надстроек отметьте пункт «Пакет анализа» и подтвердите выбор, нажав «ОК». В случае, если необходимого пункта нет в списке, вам придётся найти его вручную, воспользовавшись кнопкой «Обзор».

Так как вам ещё могут пригодиться функции Visual Basic, желательно также установить «Пакет анализа VBA». Делается это аналогичным образом, разница только в том, что вам придётся выбрать другую надстройку из списка. Если вы точно знаете, что Visual Basic вам не нужен, то можно ничего больше не загружать.

Процесс установки для версии Excel 2013 точно такой же. Для версии программы 2007, разница только в том, что вместо меню «Файл» необходимо нажать кнопку Microsoft Office, далее следуйте по пунктам, как описано для Эксель 2010. Также перед тем как начать загрузку, убедитесь, что на вашем компьютере установлена последняя версия NET Framework.

Теперь рассмотрим структуру установленного пакета. Он включает в себя несколько инструментов, которые вы можете применять в зависимости от стоящих перед вами задач. В списке, который представлен ниже, перечислены основные инструменты анализа, входящие в пакет:

  • Дисперсионный. Вы можете выбрать из предложенных вариантов в списке (однофакторный, двухфакторный с повторениями, двухфакторный без повторений). Всё зависит от количества факторов и выборок.
  • Корреляционный. Позволяет построить корреляционную матрицу. Такой подход даёт возможность определить, связаны ли большие значения одной группы данных с большими значениями другой группы. Или проделать то же самое для маленьких значений. Это называется отрицательной корреляцией.
  • Ковариационный. Используется в случаях, когда необходимо посчитать функцию «КОВАРИАЦИЯ.Г». Также такой тип анализа позволяет определить, ассоциированы ли группы данных по величине.
  • Фурье. Применяется, когда необходимо решить задачу в линейных системах либо проанализировать периодические данные.
  • Гистограмма. Очень удобно использовать для решения задач типа: распределить значение успеваемости студентов в группе.
  • Скользящее среднее. Применяется, когда нужно рассчитать значения, находящиеся в прогнозируемом периоде, основываясь на среднем значении переменной.
  • Генерация случайных чисел. Заполняет указанный диапазон случайными числами.
  • Ранг и перцентиль. Нужен, чтобы вывести таблицу с порядковым и центральным рангами.
  • Регрессия. Позволяет подобрать график набора наблюдений, применяя метод наименьших квадратов.
  • Выборка. Применяется в случаях, когда нужно создать выборку из генеральной совокупности, в качестве которой выступает входной диапазон.
  • Т-тест. Даёт возможность проверить на равенство значения по каждой выборке. Существует несколько разновидностей этого инструмента. Выбирайте тот вариант, который больше подходит для решения текущей задачи.
  • Z-тест. Этот инструмент нужен, чтобы проверять гипотезу о неразличии между средними одной и другой генеральных совокупностей относительно одно- и двусторонней гипотез.

Таблицы данных для одной переменной

Предположим, что вы рассматриваете возможность покупки дома, для чего вам придется взять ссуду под закладную в $200 000 на 30 лет, и вы хотите вычислить месячные выплаты по этой ссуде для нескольких процентных ставок. Эту информацию может предоставить таблица данных для одной переменной.

Чтобы создать такую таблицу, выполните следующие действия:

1. На новом рабочем листе введите интересующие вас процентные ставки. Для этого примера введите 6, 6,5, 7, 7,5, 8 и 8,5 процентов в ячейки ВЗ:В8. (Мы называем этот диапазон входным диапазоном, так как он содержит входные значения, которые мы хотим проверить.)

2. Затем введите формулу, которая использует входную переменную. В данном случае введите в ячейку С2 формулу:

где А2/12 — месячная процентная ставка, 360 — срок ссуды в месяцах и 200000 — размер ссуды

Обратите внимание, что эта формула ссылается на ячейку А2, которая в данный момент пустая. (При расчете числовых формул Ms Excel присваивает пустым ячейкам значение 0.) Как вы можете заметить, поскольку А2 пустая, то функция возвращает величину ежемесячных выплат, необходимую для погашения ссуды при нулевой процентной ставке

Ячейка А2 является только меткой, через которую Excel будет подставлять значения из входного диапазона. На самом деле Excel не изменяет хранимое значение в этой ячейке, поэтому такой меткой может быть любая ячейка рабочего листа вне диапазона таблицы данных.

3. Выделите диапазон таблицы данных — минимальный прямоугольный блок ячеек, включающий в себя формулу и все значения входного диапазона. В данном случае выделите диапазон В2:С8.

4. Выполните команду Данные/ Таблица подстановки. В окне диалога Таблица подстановки задайте местонахождение входной ячейки в поле Подставлять значения по строкам в или в поле Подставлять значения по столбцам в. Входная ячейка — это ячейка-метка, на которую ссылается формула таблицы данных, в данном случае, А2. Чтобы таблица данных заполнялась правильно, вы должны ввести ссылку на входную ячейку в нужное поле. Если входные значения расположены в строке, введите ссылку на входную ячейку в поле Подставлять значения по столбцам в. Если значения во входном диапазоне расположены в столбце, используйте поле Подставлять значения по строкам в. В данном примере входные значения расположены в столбце, поэтому введите $А$2 в поле Подставлять значения по строкам в.

5. Нажмите кнопку ОК. Excel выведет значения формулы для каждого входного значения в ячейках диапазона таблицы данных. В нашем примере Excel выведет шесть результатов в диапазоне СЗ:С8. При создании этой таблицы данных Excel ввел формулу массива в каждую ячейку в диапазоне СЗ:С8 (диапазон результатов). В нашей таблице формула ТАБЛИЦА вычисляет значения функции ПЛТ для каждой процентной ставки в столбце В. Например, формула в ячейке С5 вычисляет размер выплаты при ставке, равной 7 процентам.

Функция ТАБЛИЦА, используемая в формуле, имеет следующий синтаксис:

=ТАБЛИЦА(входная ячейка для строки ;входная ячейка для столбца)

Поскольку в нашем примере входные значения расположены в столбце, Excel использует ссылку на входную ячейку для столбца А2 в качестве второго аргумента функции и оставляет первый аргумент пустым (на что указывает точка с запятой).

После построения таблицы можно изменить формулу таблицы данных или любые значения во входном диапазоне для создания другого множества резуль­татов. Например, предположим, что для покупки дома вы решили занять только $185 000. Если вы измените формулу в ячейке С2 на =ПЛТ(А2/12;360; 185000) значения в выходном диапазоне изменятся.

LEN

= LEN — еще одна удобная функция для анализа данных, которая фактически выводит количество символов в любой заданной ячейке. Функцию можно использовать преимущественно при создании тегов заголовков или описаний, имеющих ограничение на количество символов. Это также может быть полезно, когда вы пытаетесь выяснить различия между разными уникальными идентификаторами, которые часто бывают довольно длинными и расположены в неправильном порядке.

В приведенном выше примере я хотел подсчитать количество просмотров, которые я получал каждый месяц. Для этого я использовал формулу = LEN (C2) в ячейке D2, чтобы получить в результате 5.

Формула: = LEN (клетка)

Исправление ошибок в формулах

Бывают ситуации, когда человек допускает ошибку при вводе формулы. В этом случае программа будет просто ее определять, как простое значение в текстовом формате. То есть, и расчетов также не будет. Так, самой распространенной ошибкой является ситуация, когда перед вводом знака “равно” ставится пробел

Здесь важно помнить, что перед знаком = не должно быть никаких пробелов, и он всегда должен располагаться перед формулой

Кроме этого, нередко ошибки появляются в синтаксисе функций. Причина этого проста – не все они просты для заполнения обычными людьми. Особенно это касается ситуаций, когда применяется сразу несколько аргументов. Поэтому ручной ввод формул рекомендуется лишь если пользователь опытный, и в таком случае синтаксис нужно тщательно перепроверять. Для того, чтобы сделать ввод функций более простым, был создан Мастер функций, который вызывается путем нажатия клавиши fx слева от строки ввода формулы.

Для обеспечения работоспособности формулы необходимо тщательно проверять ее перед вводом. В том числе, необходимо убедиться в том, что в ней нигде не стоят знаки, которые не видимы невооруженным глазом. В нашем случае таким знаком служил пробел.

Время от времени лучше удалить формулу, где стоят некоторые непечатные символы или ее синтаксис написан уж откровенно неправильно, чем искать ошибку и ее исправлять. Это же касается не только названия формулы, но и ее функций. О том, что при вводе формулы была допущена ошибка, Excel сообщит определенным кодом. Каждый из кодов имеет конкретное значение. Давайте перечислим наиболее распространенные из них.

Если хотя бы одна из этих ошибок появляется, то нужно проверить, правильно ли заполнена информация в аргументах этой функции. После этого осуществляется проверка самой формулы и то, есть ли в ней ошибки

Особенно нужно акцентировать внимание на тех из них, которые не соответствуют законам математики. Например, очень частая проблема – деление на ноль

Нередко она возникает случайно. Просто в результате вычисления определенного значения функцией, которая входит в состав формулы и служит аргументом для функции более высокого порядка, появляется число ноль. В результате, формула выдает ошибку #ДЕЛ/0.

Бывают и ситуации потруднее, когда точно сказать, где кроется ошибка, нельзя. Если приходится иметь дело со сложными функциями, то в таком случае нужно использовать специальные инструменты проверки. Следуйте этой инструкции:

  1. Выделяем ту ячейку, в которой есть ошибочная формула. Далее переходим во вкладку “Формулы”. Там нужно найти инструмент “Зависимости формул” – “Вычислить формулу”.
  2. Перед глазами пользователя появится диалоговое окно. В нем детально будет описано, как осуществлять отчет правильно. Чтобы решить проблему, необходимо нажать кнопку “Вычислить”. После этого функция будет последовательно проверяться на каждом шагу. Поэтому кнопку нужно нажать несколько раз. Таким образом можно отследить, на каком шагу возникла проблема и оперативно ее решить.

Есть еще один способ определения причин неполадок при работе с формулами. Называется этот инструмент “Проверка ошибок”. Его можно найти в том же блоке, что и предыдущий.

После того, как мы нажмем на соответствующую кнопку, появится окно. В нем будет информация о том, что вызвало ошибку, а также будут приведены рекомендации по исправлению сложившейся ситуации.

Чтобы исправить проблему, необходимо нажать на кнопку “Изменить в строке формул”. После этого формула будет работать правильно.

Примеры использования функции БИЗВЛЕЧЬ в Excel

Пример 1. В таблице, которую можно рассматривать как БД, содержатся данные о различных моделях смартфонов. Найти название бренда смартфона, который содержит процессор с минимальным числом ядер.

Вид таблиц данных и критериев:

В ячейке B2 запишем условие отбора данных следующим способом:

=МИН(СТОЛБЕЦ(B1))

Данный вариант записи позволяет унифицировать критерий для поиска данных в изменяющейся таблице (если число записей будет увеличиваться или уменьшаться со временем).

В результате получим следующее:

В ячейке A4 запишем следующую формулу:

Описание аргументов:

  • A8:F15 – диапазон ячеек, в которых хранится БД;
  • 1 – числовое указание номера поля (столбца), из которого будет выводиться значение (необходимо вывести Бренд);
  • A2:F3 – диапазон ячеек, в которых хранится таблица критериев.

Результат вычислений:

При изменении значений в таблице параметров условий мы будем автоматически получать выборку соответственных им результатов.

Для Excel 2010, 2013

Рассмотрим анализ данных в Excel: как включить и чем будет отличаться процедура активации для других версий. В большинстве вариантов программы процедура выполняется одинаково. Поэтому последовательность действий, изложенная в разделе, подходит для большинства версий, в том числе для выпусков 2013 и 2016 годов.

Включение блока инструментов

Рассматриваемый пакет относится к категории надстроек, то есть сложных аналитических дополнений. Соответственно, для включения пакета переходим в меню надстроек. Эта процедура выполняется следующим образом:

  1. зайдите во вкладку «Файл», расположенную в верхней части ленты интерфейса;
  2. с левой стороны открывающегося меню найдите раздел «Параметры Эксель» и кликните по нему;
  3. просмотрите левую часть окошка, откройте категорию надстроек (вторая снизу в списке), выберите соответствующий пункт;
  4. в выпавшем диалоговом меню найдите пункт «Управление», кликните по нему мышью;
  5. клик вызовет на экран диалоговое окно, выберите раздел надстроек, если выставлено значение, отличное от «Надстройки Excel», поменяйте его на обозначенное;
  6. нажмите на экранную кнопку «Перейти» в разделе надстроек. В правой части выпадет список надстроек, которые устанавливает программа.

Поиск пакета в надстройках Excel

Активация

Рассмотрим, как активировать аналитические функции, предоставляемые надстройкой пакета:

  1. В перечне надстроек, выпавшем после последовательного выполнения предыдущих операций, пользователю надлежит поставить знак птички напротив раздела «Пакет анализа».
  2. Выбрав активацию пакета, необходимо нажать клавишу «Ок», расположенную в верхней правой части диалогового окна.
  3. После нажатия кнопки пакет появляется на ленте функций. Для получения доступа к нему в интерфейсе программы выбирается вкладка «Данные». В правой части меню «Раздел анализа». Там пользователь найдет иконку опции «Анализ данных».

Выбор нужной надстройки

Запуск функций группы «Анализ данных»

Аналитический пакет оперирует большим набором инструментов, оптимизирующих решение статистических задач. Некоторые из числа:

  • операции с выборками;
  • построение гистограммы – разновидности столбчатой диаграммы, демонстрирующей разброс разных значений некоторого параметра в виде столбцов, площади которых соотносятся друг с другом так же, как удельные веса разных групп в рассмотренной выборе;
  • генерация случайных чисел;
  • порядковое и процентное ранжирование;
  • вариации регрессионного, дисперсионного, корреляционного, ковариационного анализа;
  • анализ по алгоритму Фурье;
  • экспоненциальное сглаживание – метод математических преобразований, преследующих цель выявления некоторого тренда или тенденции во временном ряду. Метод применяется для построения прогнозов.

Расположение функции «Анализ данных» на вкладке «Данные»

Чтобы применить ту или иную опцию, действуют по нижеприведенному алгоритму:

  1. Нажать на кнопку анализа на ленте.
  2. Кликнуть по названию необходимой пользователю функции.
  3. Нажать клавишу «Ок», находящуюся рядом с правым верхним углом окошка.
  4. В диалоговом окне указать массивы данных, используемые для решения текущей задачи.

Как включить анализ данных в Excel 2010

Функции, входящие в пакет, рассчитаны на использование чисел только с одного листа Эксель. Если нужные статистические значения помещены на нескольких листах, потребуется предварительно создать сводную таблицу, скопировав туда требуемые параметры.