Het doel van de verwerking van statistische gegevens. Statistische gegevensverwerking en zijn kenmerken. Statistische gegevensverwerking

Dia 2

Statistiek is een exacte wetenschap die methoden bestudeert voor het verzamelen, analyseren en verwerken van gegevens die massale acties, verschijnselen en processen beschrijven
Wiskundige statistiek is een tak van de wiskunde die methoden bestudeert voor het verzamelen, systematiseren en verwerken van de resultaten van observaties van willekeurige massaverschijnselen om bestaande patronen te identificeren.

Dia 3

Statistische onderzoeken

het aantal individuele bevolkingsgroepen van het land en zijn regio’s,
productie en consumptie van verschillende soorten producten,
vervoer van goederen en passagiers met verschillende vervoerswijzen,
natuurlijke hulpbronnen en nog veel meer.
De resultaten van statistische onderzoeken worden veel gebruikt voor praktische en wetenschappelijke conclusies.
Momenteel wordt statistiek op de middelbare school bestudeerd; het is een verplicht vak, omdat het met veel wetenschappen en vakgebieden wordt geassocieerd.
Om het aantal verkopen in een winkel te vergroten, de kwaliteit van de kennis op school te verbeteren en het land richting economische groei te bewegen, is het noodzakelijk om statistische onderzoeken uit te voeren en passende conclusies te trekken. En iedereen zou dit moeten kunnen doen.

Dia 4

De belangrijkste doelen van het bestuderen van de elementen van de statistiek

Vorming van vaardigheden in de primaire verwerking van statistische gegevens;
weergave en analyse van kwantitatieve informatie gepresenteerd in verschillende vormen (in de vorm van tabellen, diagrammen, grafieken van echte afhankelijkheden);
het ontwikkelen van ideeën over belangrijke statistische ideeën, namelijk: het idee van schatting en het idee van het testen van statistische hypothesen;
het ontwikkelen van het vermogen om de waarschijnlijkheid van willekeurige gebeurtenissen te vergelijken met de resultaten van specifieke experimenten.

Dia 5

Gegevensreeksen
Volume van gegevensreeksen
Bereik van gegevensreeksen
Gegevensreeksmodus
Mediaan van de serie
Rekenkundig gemiddelde
Bestelde datareeksen
Gegevensdistributietabel
Laten we het samenvatten
Nominatieve gegevensreeksen
Resultaat Frequentie
Percentage frequentie
Gegevens groeperen
Methoden voor gegevensverwerking
Laten we het samenvatten

Dia 6

Definitie

Een datareeks is een reeks resultaten van bepaalde metingen.
Bijvoorbeeld: 1) het meten van de menselijke lengte
2) Gewichtsmetingen van mensen (dieren).
3) Meterstanden (elektriciteit, water, warmte...)
4) Resultaten op de 100 meter sprint
Enz.

Dia 7

Het volume van een gegevensreeks is de hoeveelheid van alle gegevens.
Bijvoorbeeld: gegeven een reeks getallen 1; 3; 6; -4; 0
het volume zal gelijk zijn aan 5. Waarom?

Dia 8

Voltooi de taak

Bepaal het volume van deze serie.
Antwoord: 10

Dia 9

Definitie

Bereik is het verschil tussen de grootste en kleinste getallen in een gegevensreeks.
Bijvoorbeeld: als een reeks getallen 1 wordt gegeven; 3; 6; -4; 0; 2, dan is het bereik van deze gegevensreeks gelijk aan 6 (aangezien 6 – 0 = 6)

Dia 10

Voltooi de taak

Op het instituut hebben we een test afgelegd in hogere wiskunde. Er waren 10 mensen in de groep en zij kregen de bijbehorende beoordelingen: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
Bepaal het bereik van deze serie.
Antwoord: 3

Dia 11

Definitie

De modus van een datareeks is het nummer van de reeks dat het meest voorkomt in deze reeks.
Een gegevensreeks kan al dan niet een modus hebben.
In de gegevensreeksen 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 komt dus elk van de getallen 47 en 52 tweemaal voor, en de overige getallen minder dan tweemaal. In dergelijke gevallen werd overeengekomen dat de serie twee modi heeft: 47 en 52.

Dia 12

Voltooi de taak

Dus in de datareeksen
47, 46, 50, 52, 47, 52, 49, 45, 43, 53 elk van de nummers 47 en 52 komt twee keer voor, en de overige nummers minder dan twee keer. In dergelijke gevallen werd overeengekomen dat de serie twee modi heeft: 47 en 52.
Op het instituut hebben we een test afgelegd in hogere wiskunde. Er waren 10 mensen in de groep en zij kregen de juiste beoordelingen:
3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
Bepaal de modus van deze serie.
Antwoord: 4

Dia 13

Definitie

Een mediaan met een oneven aantal termen is het getal dat in het midden staat.
Een mediaan met een even aantal termen is het rekenkundig gemiddelde van de twee getallen die in het midden zijn geschreven.
Bijvoorbeeld: bepaal de mediaan van een reeks getallen
1) 6; -4; 5; -2; -3; 3; 3; -2; 3. Antwoord: -3
2) -1; 0; 2; 1; -1; 0;2; -1. Antwoord: 0

Dia 14

Voltooi de taak

Op het instituut hebben we een test afgelegd in hogere wiskunde. Er waren 10 mensen in de groep en zij kregen de bijbehorende beoordelingen: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
Bepaal de mediaan van deze reeks.
Antwoord: 4

Dia 15

Definitie

Het rekenkundig gemiddelde is het quotiënt van het delen van de som van de getallen in een reeks door hun getal.
Bijvoorbeeld: gegeven een reeks getallen -1; 0; 2; 1; -1; 0; 2; -1. Dan is het rekenkundig gemiddelde gelijk aan: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25

Dia 16

Voltooi de taak

Op het instituut hebben we een test afgelegd in hogere wiskunde. Er waren 10 mensen in de groep en zij kregen de bijbehorende beoordelingen: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
Bepaal het rekenkundig gemiddelde van deze reeks.
Antwoord: 3.9

Dia 17

Praktisch werk

Opdracht: karakteriseer de prestaties van leerling Ivanov op het gebied van wiskunde voor het vierde kwartaal.
UITVOERING VAN HET WERK:
1. Verzameling van informatie:
De cijfers uit het tijdschrift zijn: 5,4,5,3,3,5,4,4,4.
2. Verwerking van ontvangen gegevens:
volume = 9
bereik = 5 - 3 = 2
mode = 4
mediaan = 3
rekenkundig gemiddelde =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4
Kenmerken van academische prestaties: de leerling is niet altijd klaar voor de les.
Meestal studeert hij met cijfers "4". Een kwart komt uit op “4”.

Dia 18

Op eigen houtje

We moeten het volume van de reeks, het bereik van de reeks, de modus, de mediaan en het rekenkundig gemiddelde vinden:
Kaart 1. 22,5; 23; 21,5; 22; 23.
Kaart 2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
Kaart 3. 12,5; 12; 12; 12,5; 13; 12,5; 13.
Kaart 4. -1; 0; 2; 1; -1; 0; 2; -1.
Kaart 5. 125; 130; 124; 131.
Kaart 6. 120; 100; 110.

Dia 19

Laten we het controleren

Kaart 1.
rijvolume = 5
bereik van rij = 10
mode = 23
mediaan = 21,5
rekenkundig gemiddelde = 13,3
Kaart 3.
rijvolume = 7
bereik van series = 1
modus = 12,5
mediaan = 12,5
rekenkundig gemiddelde = 12,5
Kaart 2.
rijvolume = 9
bereik van rij = 10
mode = 3
mediaan = -3
rekenkundig gemiddelde = 1
Kaart 4.
rijvolume = 8
bereik van rij = 3
modus = -1
mediaan = 0
rekenkundig gemiddelde = 0,25

Dia 20

Kaart 5.
rijvolume = 4
rijbereik = 7
mode = nee
mediaan = 127
rekenkundig gemiddelde =127,5
Kaart 6.
rijvolume = 3
bereik bereik = 20
mode = nee
mediaan = 100
rekenkundig gemiddelde = 110

Dia 21

Definitie

Geordende gegevensreeksen zijn reeksen waarin de gegevens volgens een bepaalde regel zijn gerangschikt.
Hoe rangschik je een reeks getallen? (Schrijf de getallen zo dat elk volgend getal niet minder (niet meer) is dan het vorige); of schrijf enkele namen “alfabetisch” op...

Dia 22

Voltooi de taak

Gegeven een reeks getallen:
-1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
Sorteer het in oplopende cijfers.
Oplossing:
-3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
Het resultaat is een geordende serie. De gegevens zelf zijn niet veranderd, alleen de volgorde waarin ze verschijnen is veranderd.

Dia 23

Definitie

Een gegevensdistributietabel is een tabel van een geordende reeks waarin, in plaats van hetzelfde aantal te herhalen, het aantal herhalingen wordt vastgelegd.
Omgekeerd, als de distributietabel bekend is, kan een geordende reeks gegevens worden samengesteld.
Bijvoorbeeld:
Hieruit krijgen we de volgende bestelde series:
-3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8

Dia 24

Voltooi de taak

In een damesschoenenwinkel voerden ze statistisch onderzoek uit en stelden ze een bijbehorende tabel samen voor de prijs van schoenen en het aantal verkopen:
Prijs (RUB): 500 1200 1500 1800 2000 2500
Aantal: 8 9 14 15 3 1
Voor deze indicatoren moet u statistische kenmerken vinden:
maak een geordende reeks gegevens
volume aan datareeksen
serie bereik
mode serie
midden van de serie
rekenkundig gemiddelde van een gegevensreeks

Dia 25

En beantwoord de volgende vragen

Tegen welke prijs mag de winkel uit deze prijscategorieën de schoenen niet verkopen?
Schoenen, tegen welke prijs moeten deze worden gedistribueerd?
Op welke prijs moet je mikken?

Dia 26

Laten we het samenvatten

We maakten kennis met de initiële concepten van hoe statistische gegevensverwerking plaatsvindt:
Gegevens zijn altijd het resultaat van een bepaalde meting
Er zijn een aantal gegevens te vinden:
volume, bereik, modus, mediaan en
rekenkundig gemiddelde
3) elke datareeks kan zijn
organiseren en componeren
gegevensdistributietabel

Dia 27

Definitie

De nominatieve gegevensreeks bestaat NIET uit NUMERIEKE GEGEVENS, maar bijvoorbeeld uit namen; titels; nominaties...
Bijvoorbeeld: lijst met WK-finalisten sinds 1930: Argentinië, Tsjechoslowakije, Hongarije, Brazilië, Hongarije, Zweden, Tsjechoslowakije, Duitsland, Italië, Nederland, Nederland, Duitsland, Duitsland,
Argentinië, Italië, Brazilië, Duitsland, Frankrijk

Dia 28

Voltooi de taak

Zoek uit vorig voorbeeld:
volume van rij 2) modus van rij
3) maak een distributietabel
Oplossing: volume = 18; mode – Duits team.

Uw goede werk indienen bij de kennisbank is eenvoudig. Gebruik onderstaand formulier

Studenten, promovendi en jonge wetenschappers die de kennisbasis gebruiken in hun studie en werk zullen je zeer dankbaar zijn.

Geplaatst op http://www.allbest.ru/

Statistische gegevensverwerking

Invoering

statistische variantiesteekproefcorrelatie

Methoden voor de statistische verwerking van experimentele resultaten zijn wiskundige technieken, formules, methoden voor kwantitatieve berekeningen, met behulp waarvan tijdens een experiment verkregen indicatoren kunnen worden gegeneraliseerd, in een systeem kunnen worden gebracht en daarin verborgen patronen kunnen worden onthuld. We hebben het over patronen van statistische aard die bestaan tussen de variabelen die in het experiment zijn bestudeerd.

Sommige methoden van wiskundig-statistische analyse maken het mogelijk om de zogenaamde elementaire wiskundige statistieken te berekenen die de steekproefverdeling van gegevens karakteriseren, bijvoorbeeld steekproefgemiddelde, steekproefvariantie, modus, mediaan en een aantal andere. Andere methoden van wiskundige statistiek, bijvoorbeeld variantieanalyse en regressieanalyse, maken het mogelijk om de dynamiek van veranderingen in individuele steekproefstatistieken te beoordelen. Met behulp van de derde groep methoden, bijvoorbeeld correlatieanalyse, factoranalyse, methoden voor het vergelijken van steekproefgegevens, kan men op betrouwbare wijze de statistische relaties beoordelen die bestaan tussen de variabelen die in een bepaald experiment worden bestudeerd.

1. Methoden voor primaire statistische verwerking van experimentele resultaten

Alle methoden voor wiskundige en statistische analyse zijn conventioneel verdeeld in primair en secundair. Primaire methoden zijn methoden die kunnen worden gebruikt om indicatoren te verkrijgen die de resultaten van metingen in een experiment rechtstreeks weerspiegelen. Dienovereenkomstig bedoelen we met primaire statistische indicatoren de indicatoren die in de psychodiagnostische methoden zelf worden gebruikt en die het resultaat zijn van de initiële statistische verwerking van de psychodiagnostische resultaten. Secundaire methoden worden statistische verwerkingsmethoden genoemd, met behulp waarvan op basis van primaire gegevens verborgen statistische patronen worden onthuld.

Primaire methoden voor statistische verwerking omvatten bijvoorbeeld het bepalen van het steekproefgemiddelde, de steekproefvariantie, de steekproefmodus en de steekproefmediaan. Secundaire methoden omvatten gewoonlijk correlatieanalyse, regressieanalyse en methoden voor het vergelijken van primaire statistieken in twee of meer steekproeven.

Laten we methoden bekijken voor het berekenen van elementaire wiskundige statistieken.

1.1 Mode

Een numeriek kenmerk van een monster, waarvoor doorgaans geen berekeningen nodig zijn, is de zogenaamde modus. Modus is de kwantitatieve waarde van het onderzochte kenmerk, dat het vaakst in de steekproef wordt aangetroffen. Voor symmetrische verdelingen van kenmerken, inclusief de normale verdeling, valt de moduswaarde samen met de waarden van het gemiddelde en de mediaan. Voor andere soorten distributie, asymmetrisch, is dit niet typisch. In de reeks kenmerkwaarden 1, 2, 5, 2, 4, 2, 6, 7, 2 is de modus bijvoorbeeld waarde 2, omdat deze vaker voorkomt dan andere waarden - vier keer.

De mode wordt gevonden volgens de volgende regels:

1) In het geval dat alle waarden in het monster even vaak voorkomen, wordt algemeen aanvaard dat deze monsterreeks geen modus heeft. Bijvoorbeeld: 5, 5, 6, 6, 7, 7 - er is geen mode in dit voorbeeld.

2) Wanneer twee aangrenzende (aangrenzende) waarden dezelfde frequentie hebben en hun frequentie groter is dan de frequenties van andere waarden, wordt de modus berekend als het rekenkundig gemiddelde van deze twee waarden. In voorbeeld 1, 2, 2, 2, 5, 5, 5, 6 zijn de frequenties van aangrenzende waarden 2 en 5 bijvoorbeeld hetzelfde en gelijk aan 3. Deze frequentie is groter dan de frequentie van andere waarden 1 en 6 (waarvoor het gelijk is aan 1). Daarom zal de modus van deze reeks =3,5 zijn

3) Als twee niet-aangrenzende (niet aangrenzende) waarden in de steekproef gelijke frequenties hebben die groter zijn dan de frequenties van welke andere waarde dan ook, dan worden er twee modi onderscheiden. In de reeksen 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 zijn de modi bijvoorbeeld de waarden 11 en 14. In dit geval wordt gezegd dat het monster bimodaal is.

Er kunnen ook zogenaamde multimodale distributies bestaan die meer dan twee hoekpunten (modi) hebben.

4) Als de modus wordt geschat op basis van een reeks gegroepeerde gegevens, is het om de modus te vinden noodzakelijk om de groep met de hoogste frequentie van het kenmerk te bepalen. Deze groep wordt de modale groep genoemd.

1.2 Mediaan

De mediaan is de waarde van het onderzochte kenmerk, waardoor de steekproef, geordend op de waarde van dit kenmerk, in tweeën wordt gedeeld. Rechts en links van de mediaan in de geordende reeks blijft hetzelfde aantal kenmerken. Voor een steekproef van 2, 3, 4, 4, 5, 6, 8, 7, 9 zal de mediaan bijvoorbeeld de waarde 5 zijn, aangezien er links en rechts vier indicatoren zijn. Als een reeks een even aantal kenmerken bevat, dan is de mediaan het gemiddelde, genomen als de helft van de som van de waarden van de twee centrale waarden van de reeks. Voor de volgende rij 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 zal de mediaan 3,5 zijn.

Het kennen van de mediaan is nuttig om te bepalen of de verdeling van deelwaarden van het bestudeerde kenmerk symmetrisch is en de zogenaamde normale verdeling benadert. Het gemiddelde en de mediaan voor een normale verdeling zijn meestal hetzelfde of verschillen nauwelijks van elkaar. Als de steekproefverdeling van kenmerken normaal is, kunnen er methoden voor secundaire statistische berekeningen op basis van de normale verdeling van gegevens op worden toegepast. Anders is dit niet mogelijk, omdat er ernstige fouten in de berekeningen kunnen sluipen.

1.3 Steekproefgemiddelde

De steekproefgemiddelde (rekenkundig gemiddelde) waarde als statistische indicator vertegenwoordigt de gemiddelde beoordeling van de psychologische kwaliteit die in het experiment is bestudeerd. Deze beoordeling karakteriseert de mate van ontwikkeling als geheel in de groep proefpersonen die aan een psychodiagnostisch onderzoek zijn onderworpen. Door de gemiddelde waarden van twee of meer monsters rechtstreeks te vergelijken, kunnen we de relatieve mate van ontwikkeling van de beoordeelde kwaliteit beoordelen bij de mensen waaruit deze monsters bestaan.

1.4 Monsterspreiding

De spreiding (ook wel het bereik genoemd) van een monster wordt aangegeven met de letter R. Dit is de eenvoudigste indicator die voor een monster kan worden verkregen: het verschil tussen de maximale en minimale waarden van een bepaalde variatiereeks, d.w.z.

R= xmax - xmin

Het is duidelijk dat hoe meer de gemeten karakteristiek varieert, hoe groter de R-waarde is, en omgekeerd. Het kan echter voorkomen dat twee steekproefreeksen zowel het gemiddelde als het bereik hetzelfde hebben, maar de aard van de variatie van deze reeksen zal verschillend zijn. Gegeven bijvoorbeeld twee voorbeelden:

X = 10 15 20 25 30 35 40 45 50X = 30 R = 40

J = 10 28 28 30 30 30 32 32 50 J=30 R = 40

Als de gemiddelden en spreidingen voor deze twee steekproefreeksen gelijk zijn, is de aard van hun variatie verschillend. Om de aard van de variatie in steekproeven duidelijker te begrijpen, moet men naar hun verdelingen verwijzen.

1.5 Variantie

Dispersie is het rekenkundig gemiddelde van de kwadratische afwijkingen van de waarden van een variabele ten opzichte van de gemiddelde waarde.

Dispersie als statistische waarde karakteriseert hoeveel bepaalde waarden afwijken van de gemiddelde waarde in een bepaald monster. Hoe groter de variantie, hoe groter de afwijking of spreiding van de gegevens.

De vierkantswortel wordt geëxtraheerd uit de som van de kwadraten gedeeld door het aantal termen in de reeks.

Soms zijn er nogal wat initiële privé-primaire gegevens die onderworpen zijn aan statistische verwerking, en ze vereisen een groot aantal elementaire rekenkundige bewerkingen. Om hun aantal te verminderen en tegelijkertijd de vereiste nauwkeurigheid van de berekeningen te behouden, nemen ze soms hun toevlucht tot het vervangen van de oorspronkelijke steekproef van particuliere empirische gegevens door intervallen. Een interval is een groep attribuutwaarden gerangschikt op grootte, die tijdens het berekeningsproces wordt vervangen door de gemiddelde waarde.

2. Methoden voor secundaire statistische verwerking van experimentele resultaten

Met behulp van secundaire methoden voor de statistische verwerking van experimentele gegevens worden hypothesen die verband houden met het experiment direct getest, bewezen of weerlegd. Deze methoden zijn in de regel complexer dan methoden voor primaire statistische verwerking en vereisen dat de onderzoeker goed is opgeleid in elementaire wiskunde en statistiek. (7).

De groep methoden die wordt besproken, kan in verschillende subgroepen worden verdeeld:

1. Regressierekening.

2. Methoden voor het vergelijken van twee of meer elementaire statistieken (gemiddelden, varianties, enz.) met betrekking tot verschillende steekproeven.

3. Methoden voor het vaststellen van statistische relaties tussen variabelen, zoals hun onderlinge correlatie.

4. Methoden voor het identificeren van de interne statistische structuur van empirische gegevens (bijvoorbeeld factoranalyse). Laten we elk van de geïdentificeerde subgroepen van secundaire statistische verwerkingsmethoden bekijken aan de hand van voorbeelden.

2.1 Regressierekening

Regressierekening is een methode voor wiskundige statistiek die het mogelijk maakt om privé, verspreide gegevens terug te brengen tot een bepaalde lineaire grafiek die bij benadering hun interne relatie weerspiegelt, en om bij benadering de waarschijnlijke waarde van een andere variabele te kunnen schatten op basis van de waarde van een van de variabelen (7).

De grafische uitdrukking van een regressievergelijking wordt een regressielijn genoemd. De regressielijn geeft de beste voorspelling weer van de afhankelijke variabele (Y) op basis van de onafhankelijke variabelen (X).

Regressie wordt uitgedrukt met behulp van twee regressievergelijkingen, die er in het meest eenvoudige geval uitzien als vergelijkingen van een rechte lijn.

Y = een 0 + een 1 * X

X = b0 + b1 * Y

In vergelijking (1) is Y de afhankelijke variabele, X is de onafhankelijke variabele, een 0 is de vrije term, een 1 is de regressiecoëfficiënt, of de helling die de helling van de regressielijn bepaalt ten opzichte van de coördinaatassen.

In vergelijking (2) is X de afhankelijke variabele, Y is de onafhankelijke variabele, b 0 is de vrije term, b 1 is de regressiecoëfficiënt, of de helling die de helling van de regressielijn bepaalt ten opzichte van de coördinaatassen.

De kwantitatieve weergave van de relatie (afhankelijkheid) tussen X en Y (tussen Y en X) wordt regressieanalyse genoemd. De hoofdtaak van regressieanalyse is het vinden van de coëfficiënten a 0, b 0, a1 en b 1 en het bepalen van het significantieniveau van de resulterende analytische uitdrukkingen die de variabelen X en Y met elkaar verbinden.

Om de lineaire regressieanalysemethode toe te passen, moet aan de volgende voorwaarden worden voldaan:

1. De variabelen X en Y die worden vergeleken, moeten worden gemeten op een interval- of verhoudingsschaal.

2. Er wordt aangenomen dat de variabelen X en Y een normale verdelingswet hebben.

3. Het aantal variërende kenmerken in de vergeleken variabelen moet hetzelfde zijn. (5).

2.2 Correlatie

De volgende methode van secundaire statistische verwerking, waarmee het verband of de directe afhankelijkheid tussen twee reeksen experimentele gegevens wordt bepaald, wordt de correlatiemethode genoemd. Het laat zien hoe het ene fenomeen in zijn dynamiek een ander beïnvloedt of daarmee verband houdt. Dit soort afhankelijkheden bestaan bijvoorbeeld tussen grootheden die in oorzaak-en-gevolgrelaties met elkaar staan. Als blijkt dat twee verschijnselen statistisch significant met elkaar gecorreleerd zijn, en als er vertrouwen bestaat dat een van beide als oorzaak van het andere fenomeen kan fungeren, dan is de conclusie dat er tussen beide fenomenen een oorzaak-gevolg relatie bestaat definitief volgt. (7)

Wanneer een stijging van het niveau van de ene variabele gepaard gaat met een stijging van het niveau van een andere variabele, dan spreken we van een positieve correlatie. Als er sprake is van een stijging van de ene variabele terwijl het niveau van een andere daalt, spreken we van een negatieve correlatie. Als er geen verband bestaat tussen de variabelen, hebben we te maken met een nulcorrelatie. (1)

Er zijn verschillende varianten van deze methode: lineair, rangschikkend, gepaard en meervoudig. Met lineaire correlatieanalyse kunt u directe verbanden leggen tussen variabelen op basis van hun absolute waarden. Deze verbindingen worden grafisch uitgedrukt door een rechte lijn, vandaar de naam “lineair”. Rangcorrelatie bepaalt de afhankelijkheid niet tussen de absolute waarden van variabelen, maar tussen de rangtelwoorden, of rangen, die door hen worden ingenomen in een reeks geordend op waarde. Gepaarde correlatieanalyse omvat de studie van correlatie-afhankelijkheden alleen tussen paren variabelen, en meervoudige of multidimensionale, tussen vele variabelen tegelijk. Een veel voorkomende vorm van multivariate correlatieanalyse in toegepaste statistiek is factoranalyse. (5)

De rangcorrelatiecoëfficiënt in psychologisch en pedagogisch onderzoek wordt gebruikt wanneer de kenmerken waartussen een relatie wordt gelegd kwalitatief verschillend zijn en niet nauwkeurig genoeg kunnen worden beoordeeld met behulp van de zogenaamde intervalmeetschaal. Een intervalschaal is een schaal waarmee u de afstanden tussen de waarden kunt evalueren en kunt beoordelen welke groter is en hoeveel groter dan de andere. Een liniaal waarmee de lengtes van objecten worden geschat en vergeleken, is bijvoorbeeld een intervalschaal, omdat we hiermee kunnen stellen dat de afstand tussen twee en zes centimeter twee keer zo groot is als de afstand tussen zes en acht centimeter. Als we met behulp van een meetinstrument alleen maar kunnen zeggen dat sommige indicatoren groter zijn dan andere, maar niet kunnen zeggen hoeveel, dan wordt zo'n meetinstrument geen interval genoemd, maar ordinaal.

De meeste indicatoren die in psychologisch en pedagogisch onderzoek worden verkregen, hebben betrekking op ordinale schalen in plaats van op intervalschalen (bijvoorbeeld beoordelingen als ‘ja’, ‘nee’, ‘liever nee dan ja’ en andere die in punten kunnen worden omgezet). de lineaire correlatiecoëfficiënt is daarop niet van toepassing.

De methode van meervoudige correlaties maakt het, in tegenstelling tot de methode van gepaarde correlaties, mogelijk om de algemene structuur van correlatie-afhankelijkheden te identificeren die bestaan binnen multidimensionaal experimenteel materiaal, inclusief meer dan twee variabelen, en om deze correlatie-afhankelijkheden te presenteren in de vorm van een bepaald systeem.

Om de partiële correlatiecoëfficiënt toe te passen, moet aan de volgende voorwaarden worden voldaan:

1. De variabelen die worden vergeleken, moeten worden gemeten op een interval- of ratioschaal.

2. Er wordt aangenomen dat alle variabelen een normale verdelingswet hebben.

3. Het aantal variërende kenmerken in de vergeleken variabelen moet hetzelfde zijn.

4. Om het betrouwbaarheidsniveau van de Pearson-correlatierelatie te beoordelen, moet u formule (11.9) en de tabel met kritische waarden voor de Student t-test bij k = n - 2 gebruiken. (5)

2.3 Factoranalyse

Factoranalyse is een statistische methode die wordt gebruikt bij het verwerken van grote hoeveelheden experimentele gegevens. De doelstellingen van factoranalyse zijn: het verminderen van het aantal variabelen (datareductie) en het bepalen van de structuur van relaties tussen variabelen, d.w.z. classificatie van variabelen, daarom wordt factoranalyse gebruikt als datareductiemethode of als structurele classificatiemethode.

Een belangrijk verschil tussen factoranalyse en alle hierboven beschreven methoden is dat deze niet kan worden gebruikt voor het verwerken van primaire of, zoals ze zeggen, ‘ruwe’ experimentele gegevens, d.w.z. rechtstreeks verkregen uit het examen van vakken. Het materiaal voor factoranalyse zijn correlaties, of preciezer gezegd, Pearson-correlatiecoëfficiënten, die worden berekend tussen de variabelen (dat wil zeggen psychologische kenmerken) die in de enquête zijn opgenomen. Met andere woorden, correlatiematrices, of, zoals ze ook wel intercorrelatiematrices worden genoemd, worden onderworpen aan factoranalyse. De kolom- en rijnamen in deze matrices zijn hetzelfde omdat ze een lijst met variabelen vertegenwoordigen die in de analyse zijn opgenomen. Om deze reden zijn intercorrelatiematrices altijd vierkant, d.w.z. het aantal rijen daarin is gelijk aan het aantal kolommen, en symmetrisch, d.w.z. symmetrische plaatsen ten opzichte van de hoofddiagonaal hebben dezelfde correlatiecoëfficiënten.

Het belangrijkste concept van factoranalyse is factor. Dit is een kunstmatige statistische indicator die ontstaat als gevolg van speciale transformaties van de tabel met correlatiecoëfficiënten tussen de psychologische kenmerken die worden bestudeerd, of de intercorrelatiematrix. De procedure voor het extraheren van factoren uit een intercorrelatiematrix wordt matrixfactorisatie genoemd. Door factorisatie kan een ander aantal factoren uit de correlatiematrix worden gehaald, tot een aantal dat gelijk is aan het aantal oorspronkelijke variabelen. De factoren die als gevolg van factorisatie worden geïdentificeerd, zijn echter in de regel niet even belangrijk. (5)

Met behulp van geïdentificeerde factoren wordt de onderlinge afhankelijkheid van psychologische verschijnselen verklaard. (7)

Meestal wordt als resultaat van factoranalyse niet één, maar meerdere factoren bepaald die de matrix van onderlinge correlaties van variabelen op verschillende manieren verklaren. In dit geval zijn de factoren onderverdeeld in algemeen, algemeen en individueel. Algemene factoren zijn factoren waarvan de factorladingen allemaal significant verschillen van nul (nullading geeft aan dat deze variabele op geen enkele manier verband houdt met de andere en er geen enkele invloed op heeft in het leven). Algemeen zijn factoren waarvan sommige factorladingen verschillend zijn van nul. Enkelvoudige factoren zijn factoren waarbij slechts één van de belastingen significant verschilt van nul. (7)

Factoranalyse kan geschikt zijn als aan de volgende criteria wordt voldaan.

1. Het is onmogelijk om kwalitatieve gegevens die zijn verkregen op een schaal van namen, zoals bijvoorbeeld haarkleur (zwart / kastanje / rood), enz. in factoren te ontbinden.

2. Alle variabelen moeten onafhankelijk zijn en hun verdeling moet een normale verdeling benaderen.

3. Relaties tussen variabelen moeten bij benadering lineair zijn, of op zijn minst niet duidelijk kromlijnig.

4. De initiële correlatiematrix moet verschillende correlaties bevatten met een modulus hoger dan 0,3. Anders is het vrij moeilijk om factoren uit de matrix te extraheren.

5. De steekproef van proefpersonen moet groot genoeg zijn. De aanbevelingen van deskundigen variëren. Het strengste standpunt beveelt aan om geen factoranalyse te gebruiken als het aantal proefpersonen minder dan 100 bedraagt, omdat de standaardcorrelatiefouten in dit geval te groot zullen zijn.

Als de factoren echter goed gedefinieerd zijn (bijvoorbeeld met ladingen van 0,7 in plaats van 0,3), heeft de onderzoeker een kleiner monster nodig om ze te isoleren. Als bovendien bekend is dat de verkregen gegevens zeer betrouwbaar zijn (er worden bijvoorbeeld geldige tests gebruikt), kunnen gegevens over een kleiner aantal onderwerpen worden geanalyseerd. (5).

2.4 Ikbehulp van factoranalyse

Factoranalyse wordt veel gebruikt in de psychologie in verschillende richtingen die verband houden met het oplossen van zowel theoretische als praktische problemen.

In theoretische termen wordt het gebruik van factoranalyse geassocieerd met de ontwikkeling van de zogenaamde factoranalytische benadering van de studie van persoonlijkheidsstructuur, temperament en capaciteiten. Het gebruik van factoranalyse op deze gebieden is gebaseerd op de algemeen aanvaarde veronderstelling dat waarneembare en direct meetbare indicatoren slechts indirecte en/of gedeeltelijke externe manifestaties zijn van meer algemene kenmerken. Deze kenmerken zijn, in tegenstelling tot de eerste, verborgen, zogenaamde latente variabelen, omdat ze concepten of constructies vertegenwoordigen die niet beschikbaar zijn voor directe meting. Ze kunnen echter worden vastgesteld door de correlaties tussen waargenomen eigenschappen in factoren te ontbinden en factoren te isoleren die (op voorwaarde dat ze goed gestructureerd zijn) kunnen worden geïnterpreteerd als een statistische uitdrukking van de latente variabele van belang.

Hoewel factoren puur wiskundig van aard zijn, wordt aangenomen dat ze latente variabelen vertegenwoordigen (theoretisch gepostuleerde constructies of concepten), zodat de namen van de factoren vaak de essentie weerspiegelen van het hypothetische construct dat wordt bestudeerd.

Momenteel wordt factoranalyse veel gebruikt in de differentiële psychologie en psychodiagnostiek. Met zijn hulp kun je tests ontwikkelen en een structuur van verbindingen tot stand brengen tussen individuele psychologische kenmerken, gemeten door een reeks tests of testtaken.

Factoranalyse wordt ook gebruikt om testmethoden te standaardiseren, die worden uitgevoerd op een representatieve steekproef van proefpersonen.

Conclusie

Als de gegevens verkregen in een experiment kwalitatief van aard zijn, hangt de juistheid van de conclusies die op basis daarvan worden getrokken volledig af van de intuïtie, eruditie en professionaliteit van de onderzoeker, evenals van de logica van zijn redenering. Als deze gegevens van een kwantitatief type zijn, voeren ze eerst hun primaire en vervolgens secundaire statistische verwerking uit. De primaire statistische verwerking bestaat uit het bepalen van het benodigde aantal elementaire wiskundige statistieken. Bij een dergelijke verwerking gaat het vrijwel altijd om ten minste het bepalen van het steekproefgemiddelde. In gevallen waarin een informatieve indicator voor het experimenteel testen van de voorgestelde hypothesen de spreiding van de relatieve gemiddelde gegevens is, wordt de spreiding of kwadratische afwijking berekend. Het wordt aanbevolen om de mediaanwaarde te berekenen wanneer het de bedoeling is om secundaire statistische verwerkingsmethoden te gebruiken die zijn ontworpen voor een normale verdeling. Voor dit type verdeling van steekproefgegevens vallen zowel de mediaan als de modus samen met of liggen ze vrij dicht bij de gemiddelde waarde. Dit criterium kan worden gebruikt om bij benadering de aard van de resulterende distributie van primaire gegevens te beoordelen.

Secundaire statistische verwerking (vergelijking van gemiddelden, varianties, gegevensverdelingen, regressieanalyse, correlatieanalyse, factoranalyse, enz.) wordt uitgevoerd als het, om problemen op te lossen of voorgestelde hypothesen te bewijzen, nodig is om statistische patronen te bepalen die verborgen zijn in de primaire experimentele gegevens. Wanneer de onderzoeker begint met secundaire statistische verwerking, moet hij eerst beslissen welke van de verschillende secundaire statistieken hij moet toepassen om de primaire experimentele gegevens te verwerken. De beslissing wordt genomen op basis van de aard van de hypothese die wordt getest en de aard van het primaire materiaal dat als resultaat van het experiment wordt verkregen. Hier volgen enkele aanbevelingen in dit verband.

Aanbeveling 1. Als de experimentele hypothese de veronderstelling bevat dat als resultaat van het lopende psychologische en pedagogische onderzoek indicatoren van welke kwaliteit dan ook zullen toenemen (of afnemen), dan wordt het aanbevolen om bij het vergelijken van pre- en post-experimentele gegevens de Studententoets of het h2-criterium. Dit laatste komt aan bod als de primaire experimentele gegevens relatief zijn en bijvoorbeeld in een percentage worden uitgedrukt.

Aanbeveling 2. Als een experimenteel toetsbare hypothese een uitspraak bevat over een oorzaak-en-gevolg-relatie tussen bepaalde variabelen, dan is het raadzaam deze te testen door te verwijzen naar lineaire of rangcorrelatiecoëfficiënten. Lineaire correlatie wordt gebruikt wanneer de onafhankelijke en afhankelijke variabelen worden gemeten met behulp van een intervalschaal en de veranderingen in deze variabelen voor en na het experiment klein zijn. Rangcorrelatie wordt gebruikt wanneer het voldoende is om veranderingen in de volgorde van opeenvolging van onafhankelijke en afhankelijke variabelen te schatten, of wanneer hun veranderingen groot genoeg zijn, of wanneer het meetinstrument ordinaal was in plaats van interval.

Aanbeveling 3: Soms gaat een hypothese uit van de aanname dat individuele verschillen tussen proefpersonen als resultaat van het experiment zullen toenemen of afnemen. Deze aanname wordt goed geverifieerd met behulp van het Fisher-criterium, waarmee varianties voor en na het experiment kunnen worden vergeleken. Houd er rekening mee dat u met het Fisher-criterium alleen met absolute waarden van indicatoren kunt werken, maar niet met hun rangorde.

Geplaatst op Allbest.ru

...

Soortgelijke documenten

Basistechnieken en methoden voor het verwerken en analyseren van statistische gegevens. Berekening van rekenkundige, harmonische en geometrische gemiddelden. Distributiereeksen, hun belangrijkste kenmerken. Methoden voor het egaliseren van nabijgelegen dynamiek. Systeem van Nationale Rekeningen.

cursuswerk, toegevoegd op 24/10/2014

Het concept van economische analyse als wetenschap, de essentie, het onderwerp, de algemene kenmerken van methoden en sociaal-economische efficiëntie. Hoofdgroepen van econometrische methoden voor data-analyse en -verwerking. Factoranalyse van bedrijfseconomische gegevens.

samenvatting, toegevoegd 03/04/2010

Rekenkundig gemiddelde van de steekproef, variantie, standaarddeviatie. Afwijzing volgens het Chauvin-criterium. De ‘drie sigma’-regel. Het beoordelen van de significantie van het verschil tussen de gemiddelde waarden van twee monsters. Gepaarde, meervoudige regressieanalyses. Volledige factoranalyse.

cursuswerk, toegevoegd op 12/05/2012

Toepassing van verschillende methoden voor het presenteren en verwerken van statistische gegevens. Ruimtelijke statistische monsters. Paarsgewijze regressie en correlatie. Tijdreeksen. Een trend opbouwen. Praktische voorbeelden en methoden om ze op te lossen, formules en hun betekenis.

cursus hoorcolleges, toegevoegd op 26-02-2009

Statistische verwerking van meetresultaten; rekenkundig gemiddelde, kwadratisch, spreiding. Bepaling van bemonsteringsparameters: drie-sigma-wet, histogram, controlediagrammen, Ishikawa-diagram. Toepassing van kwaliteitsinstrumenten bij de vervaardiging van banken.

cursuswerk, toegevoegd op 17-10-2014

Gemiddelde waarde in statistieken, de essentie ervan en de toepassingsvoorwaarden. Typen en vormen van gemiddelden: door de aanwezigheid van een gewichtsattribuut, door de berekeningsvorm, door de dekking van de bevolking. Modus, midden. Statistische studie van de dynamiek van winst en winstgevendheid aan de hand van het voorbeeld van OJSC "Bashmebel".

test, toegevoegd op 14-06-2008

Principes van statistische gegevensverwerking, methoden en technieken die in dit proces worden gebruikt. Methodologie en hoofdfasen van het construeren van controlediagrammen, hun classificatie en typen, functionele kenmerken, bepaling van de voor- en nadelen van toepassing.

cursuswerk, toegevoegd op 23-08-2014

Berekening van numerieke kenmerken en verwerking van resultaten van steekproefwaarnemingen. Berekening en analyse van statistische indicatoren in de economie. Nationale rijkdom: elementen, beoordeling; balans van activa en passiva; vaste activa, werkkapitaalindicatoren.

cursuswerk, toegevoegd op 25-12-2012

Beschrijvende statistiek en statistische gevolgtrekking. Selectiemethoden die de representativiteit van de steekproef garanderen. De invloed van het type monster op de grootte van de fout. Taken bij het toepassen van de bemonsteringsmethode. Uitbreiding van observationele gegevens naar de algemene bevolking.

test, toegevoegd op 27-02-2011

Uitleg van het concept: intervalschaal, rekenkundig gemiddelde, niveau van statistische significantie. Hoe mode, mediaan en gemiddelde te interpreteren. Problemen oplossen met behulp van het Friedman en Rosenbaum-criterium. Berekening van de Spryman-correlatiecoëfficiënt.

Lezing 12. Methoden voor statistische verwerking van resultaten.

Methoden voor statistische verwerking van resultaten zijn wiskundige technieken, formules, methoden voor kwantitatieve berekeningen, met behulp waarvan tijdens een experiment verkregen indicatoren kunnen worden gegeneraliseerd, in een systeem kunnen worden gebracht en daarin verborgen patronen kunnen worden onthuld. We hebben het over patronen van statistische aard die bestaan tussen de variabelen die in het experiment zijn bestudeerd.

1. Methoden voor primaire statistische verwerking van experimentele resultaten

Laten we methoden bekijken voor het berekenen van elementaire wiskundige statistieken.

Mode Ze noemen de kwantitatieve waarde van het onderzochte kenmerk, dat meestal in de steekproef wordt aangetroffen.

Mediaan is de waarde van het kenmerk dat wordt bestudeerd, waardoor de steekproef, geordend op de waarde van dit kenmerk, in tweeën wordt gedeeld.

Voorbeeld gemiddelde(rekenkundig gemiddelde) waarde als statistische indicator vertegenwoordigt de gemiddelde beoordeling van de psychologische kwaliteit die in het experiment is bestudeerd.

Verstrooien(soms wordt deze waarde het bereik genoemd) van het monster wordt aangegeven met de letter R. Dit is de eenvoudigste indicator die voor een monster kan worden verkregen: het verschil tussen de maximale en minimale waarden van deze specifieke variatiereeks.

Dispersie is het rekenkundig gemiddelde van de gekwadrateerde afwijkingen van de waarden van een variabele ten opzichte van de gemiddelde waarde.

2. Methoden voor secundaire statistische verwerking van experimentele resultaten

De groep methoden die wordt besproken, kan in verschillende subgroepen worden verdeeld:

1 Regressierekening

Regressierekening is een methode voor wiskundige statistiek waarmee u privé, verspreide gegevens kunt reduceren tot een lineaire grafiek die bij benadering hun interne relatie weerspiegelt, en waarmee u bij benadering de waarschijnlijke waarde van een andere variabele kunt schatten op basis van de waarde van een van de variabelen. .

2.Correlatie

3 Factoranalyse

Bekijk vragen

1.Wat zijn statistische verwerkingsmethoden?

2. In welke subgroepen zijn secundaire methoden voor statistische verwerking onderverdeeld?

3. Leg de essentie van de correlatiemethode uit?

4. In welke gevallen worden statistische verwerkingsmethoden gebruikt?

5. Hoe effectief is volgens u het gebruik van statistische verwerkingsmethoden in wetenschappelijk onderzoek?

2. Overweeg de kenmerken van methoden voor statistische gegevensverwerking.

Literatuur

1. Gorbatov D.S. Workshop over psychologisch onderzoek: Proc. toelage. - Samara: "BAKHRAH - M", 2003. - 272 p.

2. Ermolaev A.Yu. Wiskundige statistiek voor psychologen. - M.: Moskou Psychologisch en Sociaal Instituut: Flinta, 2003.336p.

3. Kornilova T.V. Inleiding tot psychologisch experiment. Leerboek voor universiteiten. M.: Uitgeverij CheRo, 2001.

We hebben het over patronen van statistische aard die bestaan tussen de variabelen die in het experiment zijn bestudeerd.

Gegevens zijn de basiselementen die met het oog op de verwerking moeten worden geclassificeerd of gecategoriseerd 26 .

Steekproefgemiddelde,

Steekproefvariantie,

Median en een aantal anderen.

Andere methoden van wiskundige statistiek maken het mogelijk om de dynamiek van veranderingen in individuele steekproefstatistieken te beoordelen, bijvoorbeeld:

Analyse van variantie,

Regressieanalyse.

Met behulp van de derde groep methoden voor steekproefgegevens kan men op betrouwbare wijze de statistische relaties beoordelen die bestaan tussen de variabelen die in dit experiment worden bestudeerd:

Correlatieanalyse;

Factoranalyse;

Vergelijkingsmethoden.

Alle methoden voor wiskundige en statistische analyse worden conventioneel onderverdeeld in primair en secundair 27 .

Primaire methoden zijn methoden die kunnen worden gebruikt om indicatoren te verkrijgen die de resultaten van metingen in een experiment rechtstreeks weerspiegelen.

Secundaire methoden worden statistische verwerkingsmethoden genoemd, met behulp waarvan op basis van primaire gegevens daarin verborgen statistische patronen worden onthuld.

Primaire methoden voor statistische verwerking zijn bijvoorbeeld:

Bepaling van het steekproefgemiddelde;

Steekproefvariantie;

Selectieve mode;

Voorbeeld mediaan.

Secundaire methoden omvatten meestal:

Correlatieanalyse;

Regressieanalyse;

Methoden voor het vergelijken van primaire statistieken in twee of meer steekproeven.

Laten we methoden bekijken voor het berekenen van elementaire wiskundige statistieken, te beginnen met het steekproefgemiddelde.

Rekenkundig gemiddelde – het is de verhouding van de som van alle gegevenswaarden tot het aantal termen 28.

De gemiddelde waarde als statistische indicator vertegenwoordigt de gemiddelde beoordeling van de psychologische kwaliteit die in het experiment is bestudeerd.

Deze beoordeling karakteriseert de mate van ontwikkeling als geheel in de groep proefpersonen die aan een psychodiagnostisch onderzoek zijn onderworpen. Door de gemiddelde waarden van twee of meer monsters rechtstreeks te vergelijken, kunnen we de relatieve mate van ontwikkeling van de beoordeelde kwaliteit beoordelen bij de mensen waaruit deze monsters bestaan.

Het steekproefgemiddelde wordt bepaald met behulp van de volgende formule 29:

waarbij x cf het steekproefgemiddelde of het rekenkundig gemiddelde van de steekproef is;

n is het aantal proefpersonen in de steekproef of particuliere psychodiagnostische indicatoren op basis waarvan de gemiddelde waarde wordt berekend;

x k - privéwaarden van indicatoren voor individuele onderwerpen. Er zijn in totaal n van dergelijke indicatoren, dus de index k van deze variabele neemt waarden aan van 1 tot n;

∑ is het teken dat in de wiskunde wordt geaccepteerd voor het optellen van de waarden van de variabelen die zich rechts van dit teken bevinden.

Dispersie is een maatstaf voor de spreiding van gegevens ten opzichte van de gemiddelde waarde van 30.

Hoe groter de variantie, hoe groter de afwijking of spreiding van de gegevens. Het is zo bepaald dat het mogelijk is om waarden van elkaar te onderscheiden die hetzelfde gemiddelde hebben, maar een verschillende spreiding.

De variantie wordt bepaald door de volgende formule:

waar is de steekproefvariantie, of eenvoudigweg de variantie;

Een uitdrukking die betekent dat het voor alle x k van de eerste tot de laatste in een gegeven steekproef noodzakelijk is om de verschillen tussen de gedeeltelijke en gemiddelde waarden te berekenen, deze verschillen te kwadrateren en ze op te tellen;

n is het aantal proefpersonen in de steekproef of primaire waarden waaruit de variantie wordt berekend.

Mediaan is de waarde van het onderzochte kenmerk, waardoor de steekproef, geordend op de waarde van dit kenmerk, in tweeën wordt gedeeld.

Als de steekproefverdeling van kenmerken normaal is, kunnen er methoden voor secundaire statistische berekeningen op basis van de normale verdeling van gegevens op worden toegepast. Anders is dit niet mogelijk, omdat er ernstige fouten in de berekeningen kunnen sluipen.

Mode een andere elementaire wiskundige statistiek en kenmerkend voor de distributie van experimentele gegevens. Modus is de kwantitatieve waarde van het onderzochte kenmerk, dat het vaakst in de steekproef wordt aangetroffen.

Voor symmetrische verdelingen van kenmerken, inclusief de normale verdeling, vallen de moduswaarden samen met de waarden van het gemiddelde en de mediaan. Voor andere soorten distributies, asymmetrisch, is dit niet typisch.

De methode van secundaire statistische verwerking, waarmee de verbinding of directe afhankelijkheid tussen twee reeksen experimentele gegevens wordt bepaald, wordt genoemd correlatieanalysemethode. Het laat zien hoe het ene fenomeen in zijn dynamiek een ander beïnvloedt of ermee verbonden is. Dit soort afhankelijkheden bestaan bijvoorbeeld tussen grootheden die in oorzaak-en-gevolgrelaties met elkaar staan. Als blijkt dat twee verschijnselen statistisch significant met elkaar gecorreleerd zijn, en als er vertrouwen bestaat dat een van beide als oorzaak van het andere fenomeen kan fungeren, dan is de conclusie dat er tussen beide fenomenen een oorzaak-gevolg relatie bestaat definitief volgt.

Er zijn verschillende varianten van deze methode:

Met lineaire correlatieanalyse kunt u directe verbanden leggen tussen variabelen op basis van hun absolute waarden. Deze verbindingen worden grafisch uitgedrukt door een rechte lijn, vandaar de naam “lineair”.

De lineaire correlatiecoëfficiënt wordt bepaald met behulp van de volgende formule 31:

waar rxy - lineaire correlatiecoëfficiënt;

x, y- gemiddelde monsterwaarden van de vergeleken waarden;

X i ,j i - privémonsterwaarden van vergeleken hoeveelheden;

P - het totale aantal waarden in de vergeleken reeks indicatoren;

Dispersies, afwijkingen van vergeleken waarden van gemiddelde waarden.

Rangcorrelatie bepaalt de afhankelijkheid niet tussen de absolute waarden van variabelen, maar tussen de rangtelwoorden, of rangen, die door hen worden ingenomen in een reeks geordend op waarde. De formule voor de rangcorrelatiecoëfficiënt is als volgt 32:

waarbij Rs de Spearman-rangcorrelatiecoëfficiënt is;

D i - het verschil tussen de rangen van indicatoren van dezelfde onderwerpen in geordende reeksen;

P - het aantal onderwerpen of digitale gegevens (rangen) in gecorreleerde reeksen.