Также известна как график рассеяния, точечный график, координатный график или скатерограмма.
На диаграммах рассеяния можно увидеть множество точек, разбросанных по декартовой плоскости, отражающих значения по двум переменным. Если каждой оси присвоить какую-то переменную, это поможет определить, есть ли какая-то связь между этими переменными. Паттерны, которые видны на этих диаграммах рассеяния, обычно подсказывают о типах корреляции.
Мы можем выделить:
По форме корелляция различается на следующие типы:
Силу корреляции можно оценить по тому, насколько близко расположены точки на графике. Точки, которые сильно выбиваются из общего распределения, обычно именуются выбросами.
Идеальный пример использования диаграммы рассеивания:
У вас есть пара числовых данных, и вы хотите посмотреть, существует ли влияние одной переменной на другую.
Вы хотите обнаружить аномалии или выбросы в данных. Точки, которые сильно отличаются от общего распределения, могут быть ключевыми для понимания особенностей данных.
Дата-аналитик
Эксперт по данным