Пример 4. Диаграмма рассеивания

Вернемся к примеру с рейтингом ведущих университетов. Как вы помните, таблица, которую можно увидеть ниже, кроме общего числа баллов содержала значения тех критериев, по которым производилась оценка университета: выпускники, преподаватели, статьи и т.д.

Как формировался при этом общий балл, мы не знаем. Что, например, было более важным: количество опубликованных научных статей (столбец "Статьи") или количество упоминаний об университете в средствах массовой информации (столбец "Ссылки"). Оказывается, это можно выяснить с помощью диаграмм рассеивания:

Даже на глаз видно, что на первой диаграмме точки ложатся ближе к воображаемой прямой, чем на второй, где они образуют бесформенное облако. Значит, при определении общего рейтинга количество опубликованных статей было более важным, чем количество упоминаний об университете. Вот так с помощью диаграмм можно извлечь информацию, скрытую в "глубине" статистических данных.

А как будет выглядеть облако точек, если в качестве X взять общее количество набранных баллов, а в качестве Y - место в рейтинге?