Як розрахувати лінійний коефіцієнт кореляції

Лінійний коефіцієнт кореляції, що позначається буквою r - Це міра лінійної кореляції (відношення, що враховує як інтенсивність, так і напрямок) між двома змінними. Воно знаходиться в інтервалі від -1 до +1, причому знаки плюс і мінус використовуються для представлення позитивної та негативної кореляції. Якщо лінійний коефіцієнт кореляції дорівнює -1, то відношення між двома змінними - це ідеальна негативна аппроксімація- якщо ж він дорівнює +1, то співвідношення являє собою ідеальну позитивну апроксимацію. В інших випадках, дві змінні можуть характеризуватися позитивної кореляцією, негативною кореляцією або відсутністю кореляції. Якщо вам потрібно знайти коефіцієнт лінійної кореляції, то починайте читати крок 1.




Частина 1 з 2: Основи

  1. 1

    Засвойте концепцію кореляції. Кореляцією називається статистичне відношення між двома величинами. Фахівці в галузі статистики часто використовують кореляцію для того, щоб визначити взаємозв`язок двох або більше змінних.

  2. 2

    Знайте, як знайти середнє. Середнє арифметичне, або просто "середнє", добірки даних обчислюється складанням всіх значень і діленням результату на кількість значень.
    • Середнє значення позначається як символ змінної з горизонтальною рисою над ним.

  3. 3

    Зверніть увагу на важливість середньоквадратичного відхилення. У статистиці середньоквадратичне відхилення є мірою варіювання і відображає те, як дані розсіяні по відношенню до середнього значення.
    • Математично середньоквадратичне відхилення позначається як Sx, Sy, і так далі (що означає "середньоквадратичне відхилення x,"" Середньоквадратичне відхилення y,"Тощо).

  4. 4

    Розберіться в записі суми. Оператор суми - один з найпоширеніших в математиці і означає суму значень. Він позначається великою грецькою буквою сигма, або?.

  5. 5

    Вивчіть найпростішу формулу для розрахунку лінійного коефіцієнта кореляції. Формула розрахунку лінійного коефіцієнта кореляції використовує середні значення, среднеквадратические відхилення і кількість пар у групі даних (що позначаються n). Вона виглядає наступним чином:

Частина 2 з 2: Знаходження лінійного коефіцієнта кореляції

  1. 1

    Зберіть всі ваші дані. Щоб розрахувати лінійний коефіцієнт кореляції, спочатку погляньте на ваші пари даних. Корисно записати їх у вигляді таблиці.
    • Припустимо, наприклад, що у вас є пари даних x і y. Таблиця буде виглядати наступним чином:

  2. 2

    Обчисліть середнє значення x-ів. Щоб обчислити середнє значення, вам потрібно буде скласти всі значення x, а потім розділити отриману суму на кількість значень, використовуючи наступну формулу:
    • У нашому прикладі у нас є чотири значення для x. Щоб обчислити середнє, складіть всі значення x, а потім розділіть їх на 4. Ваші розрахунки будуть виглядати так:

  3. 3

    Знайдіть середнє значення y-ів. Щоб знайти середнє значення y-ів, дотримуйтеся таких же кроків, склавши всі значення y, а потім розділивши їх на кількість значень:


    • У нашому прикладі є чотири значення y. Складіть всі ці значення, а потім розділіть відповідь на 4. Ваші розрахунки будуть виглядати так:

  4. 4

    Визначте середньоквадратичне відхилення x. Як тільки ви отримаєте ваші середні значення, ви можете вирахувати середньоквадратичне відхилення. Для цього скористайтеся наступною формулою:
    • Для наведеного вище прикладу ваші розрахунки повинні виглядати наступним чином:
    • Зверніть увагу, що частина рівняння, що містить xi - Середнє значення x, обчислюється відніманням середнього з кожного значення x у вашій таблиці.

  5. 5

    Обчисліть середньоквадратичне відхилення y. Використовуючи такі ж кроки, знайдіть середньоквадратичне відхилення y. Використовуйте наступну формулу:
    • У нашому прикладі ваші розрахунки будуть мати наступний вигляд:
    • І знову, зверніть увагу, що частина рівняння, що містить yi - Середнє значення y обчислюється відніманням середнього з кожного значення y у вашій таблиці.

  6. 6

    Знайдіть лінійний коефіцієнт кореляції. Тепер у вас є середні значення і среднеквадратические відхилення ваших змінних, отже, ви можете переходити до до використання формули лінійної кореляції. Пам`ятайте, що n являє собою число наявних у вас змінних. Інша інформація щодо даної формули була розглянута вище.
    • У нашому прикладі ви повинні вводити дані в формулу лінійного коефіцієнта кореляції і робити обчислення наступним чином:


      Таким чином, коефіцієнт лінійної кореляції дорівнюватиме 0,989949. Зверніть увагу, що це число дуже близько до +1, тому ці значення характеризуються сильною позитивною кореляцією.

Поради

  • Лінійний коефіцієнт кореляції іноді називають "коефіцієнтом кореляції Пірсона", на честь запропонував його вченого, Карла Пірсона.
  • Загалом, коефіцієнт лінійної кореляції більше 0,8 (як позитивний, так і негативний) відображає сильну кореляцію, коефіцієнт лінійної кореляції менше 0,5 (знову ж, як позитивний, так і негативний) відображає слабку кореляцію.