Як розрахувати лінійний коефіцієнт кореляції
Лінійний коефіцієнт кореляції, що позначається буквою r - Це міра лінійної кореляції (відношення, що враховує як інтенсивність, так і напрямок) між двома змінними. Воно знаходиться в інтервалі від -1 до +1, причому знаки плюс і мінус використовуються для представлення позитивної та негативної кореляції. Якщо лінійний коефіцієнт кореляції дорівнює -1, то відношення між двома змінними - це ідеальна негативна аппроксімація- якщо ж він дорівнює +1, то співвідношення являє собою ідеальну позитивну апроксимацію. В інших випадках, дві змінні можуть характеризуватися позитивної кореляцією, негативною кореляцією або відсутністю кореляції. Якщо вам потрібно знайти коефіцієнт лінійної кореляції, то починайте читати крок 1.
Кроки
Частина 1 з 2: Основи
1
Засвойте концепцію кореляції. Кореляцією називається статистичне відношення між двома величинами. Фахівці в галузі статистики часто використовують кореляцію для того, щоб визначити взаємозв`язок двох або більше змінних.2
Знайте, як знайти середнє. Середнє арифметичне, або просто "середнє", добірки даних обчислюється складанням всіх значень і діленням результату на кількість значень.- Середнє значення позначається як символ змінної з горизонтальною рисою над ним.
3
Зверніть увагу на важливість середньоквадратичного відхилення. У статистиці середньоквадратичне відхилення є мірою варіювання і відображає те, як дані розсіяні по відношенню до середнього значення.- Математично середньоквадратичне відхилення позначається як Sx, Sy, і так далі (що означає "середньоквадратичне відхилення x,"" Середньоквадратичне відхилення y,"Тощо).
4
Розберіться в записі суми. Оператор суми - один з найпоширеніших в математиці і означає суму значень. Він позначається великою грецькою буквою сигма, або?.5
Вивчіть найпростішу формулу для розрахунку лінійного коефіцієнта кореляції. Формула розрахунку лінійного коефіцієнта кореляції використовує середні значення, среднеквадратические відхилення і кількість пар у групі даних (що позначаються n). Вона виглядає наступним чином:
Частина 2 з 2: Знаходження лінійного коефіцієнта кореляції
1
Зберіть всі ваші дані. Щоб розрахувати лінійний коефіцієнт кореляції, спочатку погляньте на ваші пари даних. Корисно записати їх у вигляді таблиці.- Припустимо, наприклад, що у вас є пари даних x і y. Таблиця буде виглядати наступним чином:
2
Обчисліть середнє значення x-ів. Щоб обчислити середнє значення, вам потрібно буде скласти всі значення x, а потім розділити отриману суму на кількість значень, використовуючи наступну формулу:- У нашому прикладі у нас є чотири значення для x. Щоб обчислити середнє, складіть всі значення x, а потім розділіть їх на 4. Ваші розрахунки будуть виглядати так:
3
Знайдіть середнє значення y-ів. Щоб знайти середнє значення y-ів, дотримуйтеся таких же кроків, склавши всі значення y, а потім розділивши їх на кількість значень:- У нашому прикладі є чотири значення y. Складіть всі ці значення, а потім розділіть відповідь на 4. Ваші розрахунки будуть виглядати так:
4
Визначте середньоквадратичне відхилення x. Як тільки ви отримаєте ваші середні значення, ви можете вирахувати середньоквадратичне відхилення. Для цього скористайтеся наступною формулою:- Для наведеного вище прикладу ваші розрахунки повинні виглядати наступним чином:
- Зверніть увагу, що частина рівняння, що містить xi - Середнє значення x, обчислюється відніманням середнього з кожного значення x у вашій таблиці.
5
Обчисліть середньоквадратичне відхилення y. Використовуючи такі ж кроки, знайдіть середньоквадратичне відхилення y. Використовуйте наступну формулу:- У нашому прикладі ваші розрахунки будуть мати наступний вигляд:
- І знову, зверніть увагу, що частина рівняння, що містить yi - Середнє значення y обчислюється відніманням середнього з кожного значення y у вашій таблиці.
6
Знайдіть лінійний коефіцієнт кореляції. Тепер у вас є середні значення і среднеквадратические відхилення ваших змінних, отже, ви можете переходити до до використання формули лінійної кореляції. Пам`ятайте, що n являє собою число наявних у вас змінних. Інша інформація щодо даної формули була розглянута вище.- У нашому прикладі ви повинні вводити дані в формулу лінійного коефіцієнта кореляції і робити обчислення наступним чином:
Таким чином, коефіцієнт лінійної кореляції дорівнюватиме 0,989949. Зверніть увагу, що це число дуже близько до +1, тому ці значення характеризуються сильною позитивною кореляцією.
- У нашому прикладі ви повинні вводити дані в формулу лінійного коефіцієнта кореляції і робити обчислення наступним чином:
Поради
- Лінійний коефіцієнт кореляції іноді називають "коефіцієнтом кореляції Пірсона", на честь запропонував його вченого, Карла Пірсона.
- Загалом, коефіцієнт лінійної кореляції більше 0,8 (як позитивний, так і негативний) відображає сильну кореляцію, коефіцієнт лінійної кореляції менше 0,5 (знову ж, як позитивний, так і негативний) відображає слабку кореляцію.