Корелацията и коефициента на корелация, корелация

Съотношение - степен на връзка между 2 или повече независими явления.

Съотношението е положителна или отрицателна.

Положителна корелация (линия) се появява докато вариране на 2 променливи в същата посока (положителен или отрицателен). Например, връзката между броя на потребителите да се връщат към сайта от SERPs и натоварването на сървъра: колкото повече потребители, толкова по-голяма тежест.







Съотношението е отрицателен (обратна). ако промяната в едно количество води до промяна в другата обратното. Например, с увеличаване на данъчната тежест върху доходите си е намалена от компанията. Колкото повече данъци, толкова по-малко пари за развитие.

Корелацията и коефициента на корелация, корелация
Типичните видове корелации

Ефикасност корелация като статистически инструмент е възможността да изразят отношенията между двете променливи с помощта на коефициента на корелация.

Корелационният коефициент (СС) е в диапазона от числа между 1 и 1.

Ако стойността QC от 1, трябва да се разбира, че при всяка смяна на първата променлива случва еквивалентна промяна втората променлива в една и съща посока.







Корелацията и коефициента на корелация, корелация
Положителна корелация на концентрациите на етанол в кръвта и синовиалната

Ако стойността на KK е 1, след това при всяка промяна настъпва еквивалент промяна на втората променлива в обратна посока.

Корелацията и коефициента на корелация, корелация
А отрицателна корелация между индекса води до 100 м с препятствия и скокове с дължина

В по-голяма степен на -1 или 1, по-силна е връзката между променливите. Стойност нула (или близо до 0), значителна асоциация между 2 променливи отсъстват или много минимални.

Тълкуване на стойности на коефициент на корелация

Много висока корелация

Съотношение отразява само на връзката между променливите и не се говори за причинно-следствената връзка: положителна или отрицателна корелация между 2 променливи не означава непременно, че промяната в една променлива води до промяна в другия.

Може би има някаква трета променлива засяга причината за наличието или липсата на корелация.

Коефициентът на корелация не се изчислява:

  • когато връзката между две променливи не е линейна, например квадратна;
  • данните съдържат повече от 1 секунда наблюдение във всеки отделен случай;
  • Има аномалии в наблюденията (емисии, "ренегати");
  • данни съдържа изразени наблюдения подгрупи.