диаграмма рассеяния: как не рассеяться вместе с точками

Также известна как график рассеяния, точечный график, координатный график или скатерограмма.

На диаграммах рассеяния можно увидеть множество точек, разбросанных по декартовой плоскости, отражающих значения по двум переменным. Если каждой оси присвоить какую-то переменную, это поможет определить, есть ли какая-то связь между этими переменными. Паттерны, которые видны на этих диаграммах рассеяния, обычно подсказывают о типах корреляции.

Мы можем выделить:

По форме корелляция различается на следующие типы:

Силу корреляции можно оценить по тому, насколько близко расположены точки на графике. Точки, которые сильно выбиваются из общего распределения, обычно именуются выбросами.

Иногда на графиках могут быть нарисованы линии или кривые, которые помогают проанализировать данные. Эти линии стараются быть как можно ближе ко всем точкам, чтобы проиллюстрировать, как все эти точки могли бы выстроиться в одну линию. Этот элемент называется «линией наилучшего соответствия» или «линией общего направления» и помогает при оценке через интерполяцию.

Идеальный пример использования диаграммы рассеивания:

У вас есть пара числовых данных, и вы хотите посмотреть, существует ли влияние одной переменной на другую.

Вы хотите обнаружить аномалии или выбросы в данных. Точки, которые сильно отличаются от общего распределения, могут быть ключевыми для понимания особенностей данных.


Статью подготовили:
Саша Ляпина

Дата-аналитик

Варя Гучек

Эксперт по данным

Почитаем ещё?
ЧАСТЬ К ЦЕЛОМУ
Демографическая пирамида
Также известна как возрастно-половая пирамида населения или гистограмма
СРАВНЕНИЯ
Ящик с усами
Простой, любимый усатик, который всегда поддержит и поможет