Як порахувати величину P або значення ймовірності

P-значення це статистична величина, яка допомагає вченим визначити, чи коректні їх гіпотези. P-значення використовуються для визначення того, чи підпадають результати експерименту в діапазон значень, нормальний для спостерігається величини. Зазвичай якщо P-значення для набору даних менше, ніж заздалегідь певне число (наприклад 0,05), то вчені повинні відхилити "нульову гіпотезу" свого експерименту. Іншими словами, вони зроблять висновок, що змінні в їхньому експерименті НЕ надають достатнього ефекту на результати. В даний час p-значення зазвичай можна знайти в довіднику, якщо спочатку порахувати значення хи квадрат.

Кроки

  1. 1

    Визначте очікувані у вашому експерименті результати. Зазвичай коли вчені проводять експеримент, у них вже є ідея того, які результати вважати "нормальними" або "типовими". Це може бути засноване на експериментальних результатах минулих дослідів, на достовірних наборах даних, на даних з наукової літератури, або вчений може ґрунтуватися на будь-яких інших джерелах. Для вашого експерименту визначте очікувані результати, і висловіть їх у вигляді чисел.
    • Приклад: Наприклад, більш ранні дослідження показали, що у вашій країні червоні машини частіше отримують штрафи за перевищення швидкості, ніж сині машини. Наприклад, середні результати показують перевагу 2: 1 червоних машин перед синіми. Ми хочемо визначити, чи відноситься поліція точно так само упереджено до кольору машин в вашому місті. Для цього ми будемо аналізувати штрафи, видані за перевищення швидкості. Якщо ми візьмемо випадковий набір з 150 штрафів за перевищення швидкості, виданих або червоним, або синім автомобілям, ми очікуємо, що 100 штрафів буде виписано червоним автомобілям, а 50 синім, якщо поліція в нашому місті так само упереджено ставиться до кольору машин, як це спостерігається по всій країні.

  2. 2

    Визначте спостережувані результати вашого експерименту. Тепер, коли ви визна очікувані результати, необхідно провести експеримент, і знайти дійсні (або "спостережувані") значення. Вам знову необхідно представити ці результати у вигляді чисел. Якщо ми створюємо експериментальні умови, і спостережувані результати відрізняються від очікуваних, то у нас є дві можливості - або це сталося випадково, або це викликано саме нашим експериментом. Мета перебування p-значення як раз і полягає в тому, щоб визначити, чи відрізняються спостережувані результати від очікуваних настільки, щоб можна було не відкидати "нульову гіпотезу" - гіпотезу про те, що між експериментальними змінними і спостерігаються результатами немає ніякого зв`язку.
    • Приклад: Наприклад, у нашому місті ми випадково вибрали 150 штрафів за перевищення швидкості, які були видані або червоним, або синім автомобілям. Ми визначили, що 90 штрафів були виписані червоним автомобілям, і 60 синім. Це відрізняється від очікуваних результатів, які дорівнюють 100 і 50, відповідно. Чи справді наш експеримент (в даному випадку, зміна джерела даних з національного на міський) привів до даного зміні в результатах, або наша міська поліція ставиться упереджено точно так же, як і в середньому по країні, а ми бачимо просто випадкове відхилення? P-значення допоможе нам це визначити.

  3. 3

    Визначте число ступенів свободи вашого експерименту. Число ступенів свободи це ступінь змінності вашого експерименту, яка визначається числом категорій, які ви досліджуєте. Рівняння для числа ступенів свободи - Число ступенів свободи = n-1, де "n" це число категорій або змінних, які ви аналізуєте в своєму експерименті.
    • Приклад: У нашому експерименті дві категорії результатів: одна категорія для червоних машин, і одна для синіх машин. Тому в нашому експерименті у нас 2-1 = 1 ступінь свободи. Якби ми порівнювали червоні, сині та зелені машини, у нас було б 2 ступеня свободи, і так далі.




  4. 4

    Порівняйте очікувані і спостережувані результати за допомогою критерію хи квадрат. Хі квадрат (пишеться "x") це числове значення, яке вимірює різницю між очікуваними і спостережуваними значеннями експерименту. Рівняння для хі-квадрата наступне x =? ((o-e) / e), де "o" це спостережуване значення, а "e" це очікуване значення. Підсумуйте результати даного рівняння для всіх можливих результатів (дивись нижче).
    • Зауважте, що дане рівняння включає оператор підсумовування ? (Сигма). Іншими словами, вам необхідно підрахувати ((| oe | -.05) / e) для кожного можливого результату, і скласти отримані числа, щоб отримати значення критерію хі-квадрат. У нашому прикладі у нас два можливих результату - або машина, що отримала штраф червона, або синя. Тому ми повинні порахувати ((oe) / e) двічі - один раз для червоних машин, і один раз для синіх машин.
    • Приклад: Давайте підставимо наші очікувані і спостережувані значення в рівняння x =? ((Oe) / e). Пам`ятайте, що через оператора підсумовування нам необхідно порахувати ((oe) / e) двічі - один раз для червоних автомобілів, і один раз для синіх автомобілів. Ми виконаємо цю роботу таким чином:
      • x = ((90-100) / 100) + (60-50) / 50)
      • x = ((-10) / 100) + (10) / 50)
      • x = (100/100) + (100/50) = 1 + 2 = 3 .



  5. 5

    Виберіть рівень значущості. Тепер, коли ми знаємо число ступенів свободи нашого експерименту, і дізналися значення критерію хі-квадрат, нам потрібно зробити ще одну річ перед тим, як ми знайдемо наше p-значення. Нам потрібно визначити рівень значимості. Говорячи простою мовою, рівень значущості показує, наскільки ми впевнені в наших результатах. Низьке значення для значимості відповідає низькій вірогідності того, що експериментальні результати вийшли випадково, і навпаки. Рівні значущості записуються у вигляді десяткових дробів (таких як 0.01), що відповідає ймовірності того, що експериментальні результати ми отримали випадково (в даному випадку ймовірність цього 1%).
    • За угодою, вчені зазвичай встановлюють рівень значимості своїх експериментів рівним 0.05, або 5%. Це означає, що експериментальні результати, які відповідають таким критерієм значимості, тільки з імовірністю 5% могли вийти чисто випадково. Іншими словами, існує 95% вірогідність, що результати були викликані тим, як учений маніпулював експериментальними змінними, а не випадково. Для більшості експериментів 95% впевненості наявності зв`язку між двома змінними достатньо, щоб вважати, що вони "дійсно" пов`язані один з одним.
    • Приклад: для нашого прикладу з червоними і синіми машинами, давайте підемо угодою між вченими, і встановимо рівень значимості в 0.05.

  6. 6

    Використовуйте таблицю з даними розподілу хі-квадрат, щоб знайти ваше p-значення. Вчені та статисти використовують великі таблиці для обчислення p-значення своїх експериментів. Дані таблиці зазвичай мають вертикальну вісь ліворуч, відповідну числу ступенів свободи, і горизонтальну вісь зверху, відповідну p-значенням. Використовуйте дані таблиці, щоб спочатку знайти число ваших ступенів свободи, потім подивіться на ваш ряд зліва направо, поки не знайдете перше значення, більше вашого значення хі-квадрат. Подивіться на відповідне p-значення вгорі вашого шпальти. Ваше p-значення знаходиться між цим числом і наступним за ним (тим, яке знаходиться лівіше вашого).
    • Таблиці з розподілом хі-квадрат можна отримати з багатьох джерел - їх можна просто знайти онлайн, або подивитися в наукових книгах або книгах по статистиці. Якщо у вас немає під рукою таких книг, використовуйте картинку вище або яку-небудь вільну таблицю онлайн, наприклад на сайті medcalc.org. Вона розташована тут.
    • Приклад: Наше значення критерію хі-квадрат дорівнювало 3. Тому давайте використаємо таблицю розподілу хі-квадрат на картинці вище, щоб знайти приблизне p-значення. Так як ми знаємо, що в нашому експерименті всього 1 ступінь свободи, виберемо найпершу рядок. Йдемо зліва направо по цьому рядку, поки не зустрінемо значення, більше 3, нашого значення критерію хі-квадрат. Перше, яке ми знаходимо це 3.84. Дивимося вгору нашого шпальти, і бачимо, що відповідне p-значення дорівнює 0.05. Це означає, що наше p-значення між 0.05 і 0.1 (Наступне p-значення в таблиці по зростанню).

  7. 7

    Вирішіть, відхилити або залишити вашу нульову гіпотезу. Так як ви визначили приблизну p-значення для вашого експерименту, вам необхідно вирішити, відхиляти чи нульову гіпотезу вашого експерименту чи ні (нагадуємо, це гіпотеза про те, що експериментальні змінні, якими ви маніпулювали НЕ вплинули на спостережувані вами результати). Якщо ваше p-значення менше, ніж ваш рівень значимості - вітаємо, ви довели, що дуже ймовірна зв`язок між змінними, якими ви маніпулювали і результатами, які ви спостерігали. Якщо ваше p-значення вище, ніж ваш рівень значимості, ви не можете з упевненістю сказати, чи були спостережувані вами результати результатом чистій випадковості або маніпуляцією вашими змінними.
    • Приклад: Наше p-значення знаходиться між 0,05 і 0,1. Це явно НЕ менше, ніж 0,05, тому, на жаль, ми не можемо відхилити нашу нульову гіпотезу. Це означає, що ми не досягли мінімум 95% ймовірності того, щоб сказати, що поліція в нашому місті видає штрафи червоним і синім автомобілям з такою ймовірністю, яка досить сильно відрізняється від середньої по країні.
    • Іншими словами, існує 5-10% шанс, що спостережувані нами результати - це не наслідки зміни місця (аналізу міста, а не всієї країни), а просто випадковість. Так як ми зажадали точності менше ніж 5%, ми не можемо сказати що ми впевнені в тому, що поліція нашого міста менш упереджено ставиться до червоних автомобілям - існує невелика (але статистично значуща) ймовірність, що це не так.

Поради

  • Науковий калькулятор зробить обчислення простіше. Ви також можете використовувати калькулятори онлайн.
  • Ви можете підрахувати p-значення з використанням деяких комп`ютерних програм, включаючи як частоїспользуємиє програми електронних таблиць, так і більш спеціалізоване програмне забезпечення.