Koncept af Chi-Square-test

I denne artikel diskuteres begrebet chi-square test.

Chi-kvadratprøven blev brugt til at teste, at alleler adskiller sig fra Mendelske principper. Det kræves en sammenligning af forventede og observerede tal. Det bruges i statistikker til at bedømme betydningen af ​​prøveudtagningsdataene. Prof. Fisher udviklede chi-square test. Symbolisk skrevet som X 2 (udtales som Ki-square).

Det er en statistisk foranstaltning, hvor det er muligt at vurdere betydningen af ​​forskellen mellem de observerede genotypiske tal (frekvenser) og de forventede tal (frekvenser) opnået fra noget hypotetisk univers.

Hvorvidt det eksperimentelle og forudsagte forhold er i god overensstemmelse eller ej. Dette kunne testes af Chi Square Test. Denne test bestemmer, at i løbet af enhver forsøgsprocedure, der beskæftiger sig med kvantitative data, kan en vis variation, der kaldes "eksperimentel fejl", tilskrives tilfældighedsfejl alene.

Dette kan beregnes med følgende formel:

X 2 = Σ = (observeret værdi - forventet værdi) 2 / forventet værdi

Lad os tage eksemplet på forholdet mellem fænotype og genotype af eksperimenter udført af Mendel. Ved at anvende X 2 viser resultaterne, at de observerede frekvenser er i overensstemmelse med de forudsagte forhold. Dataene fra Mendeles faktiske eksperimenter er angivet i nedenstående tabel. Variationerne i det forventede og forudsagte forhold skyldes kun eksperimentelle fejl.

Mendel observerede i sit eksperiment forholdet som 9: 3: 3: 1 i dihybridkors i F2-generationen, mens forholdet i monohybridkors i F2-generationen var 1: 2: 1. Han fandt 315 runder, gule frø, 101 runder, grønne frø, 108 rynke, gule frø og 32 rynke, grønne frø.

Så de forventede tal for hver fænotype er 556 (9/16) = 312, 75 runde, gule frø; 556 (3/16) = 104, 25 runde. Grønne frø; 556 (3/16) = 104, 25 rynke, gule frø og 556 (1/16) = 34, 75 rynke, grønne frø. Chi-square vil vise, om forskellen mellem det faktiske og forudsagte forhold skyldes eksperimentelle fejl eller ej.

Den beregnede Chi-kvadratværdi er 0, 470, hvilket er ved at anvende med følgende formel:

X 2 = Σ = (observeret værdi - forventet værdi) 2 / forventet værdi

Graden af ​​frihed er nødvendig for beregningen af ​​X 2, antallet af uafhængige begrænsninger bestemmer antallet af frihedsgrader (eller df). Graden af ​​frihed er et mål for antallet af uafhængige variabler, der er til stede i et givet eksperiment.

Det siges, at fejlinishensyn kun påvirker en uafhængig variabel. I Mendels eksperimenter nævnt ovenfor er variablerne kun 4, så frihedsgraden er 4 -1 = 3. Antallet af tre fænotypiske klasser er bestemt, nummeret på den fjerde klasse er fikset.

For at finde ud af sandsynligheden skal vi konsultere Chi-square bord.

Bordet er angivet som under:

Hypotesen er aldrig aftalt eller ueniggjort af P-værdien. Resultaterne af investigatøren, som er acceptable eller uacceptable med hensyn til hypotesen, evaluerer resultaterne af Chi-kvadratobservationerne. De 5 procentpoint (0-05) på bordet vælges normalt som en vilkårlig standard til bestemmelse af betydning eller godhed ved pasform.

Tabelværdi for X 2 for 3 frihedsgrader ved 5% er 7, 82, en chi-kvadratværdi er 0, 47, hvilket er lavere end bordværdien, og derfor er det korrekt. Det kan med andre ord siges, at en sandsynlighed ved 5% niveau af betydning er 7, 82, hvilket er mere / større derfor er hypotesen korrekt. Hvis det er mindre end 5%, afvises det.

Lad os tage et andet eksempel for at forstå anvendelsen af ​​chi-square tests. Genetisk teori siger, at børn med en forælder af blodtype A og den anden af ​​blodtype B altid vil være af en af ​​de tre typer A, AB, B, og at andelen af ​​de tre typer i gennemsnit vil være som 1: 2 : 1. En prøve på 300 børn blev indsamlet - 30% viste sig at være type A, 45% - type AB og resten -type B.

Bordværdien X 2 for (3 - 1) 2d.f. ved 5% (0, 05) niveau af betydning er 5, 99. Den beregnede værdi af chi-kvadrat er 4, 5, som er mindre end tabelværdien og kan tilskrives at have fundet sted på grund af en chancefejl i eksperimentet. Dette støtter den teoretiske hypotese af teorien om arv (adskillelse af alleler), at A, AB og B står i andelen 1: 2: 1.

Et andet eksempel i denne forbindelse er som følger:

Andelen af ​​bønnen i fire grupper, nemlig A, B, C og D, skal være 9: 3: 3: 1. En bonde såede 1600 bønner. Resultaterne af hans eksperiment viser, at dataene i fire grupper er 882.313.287 og 118. Støtter eksperimentelle resultater teorien om at de er i forholdet 9: 3: 3: 1?

Med nulhypotesen om, at eksperimentets resultater understøtter teorien, er de forventede frekvenser:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900.300.300.100

Dermed:

Tabellværdien af ​​X 2 til 3 df ved 5% niveau af betydning = 7, 815.

Da den beregnede værdi af X 2 er mindre end tabelværdien, kan hypotesen accepteres, og resultaterne stemmer overens med teorien.

Chi-square-testen bruges også til at bestemme, om befolkningen er i Hardy-Weinberg Equilibrium.

En brug af Hardy-Weinberg-metoden er at forudsige hyppigheden af ​​individuelle homozygote for en skadelig recessiv allel. Disse forfattere har opdaget, at en tilfældigt parrende population (panmiktik) uden mutationer, intet udvælgelsestryk, ingen genetisk drift og ingen migration, har de relative frekvenser af hvert gen (allel) tendens til at forblive konstant fra generation til generation.

Loven fortæller genotypefrekvenser til genfrekvenser i tilfældigt parrede populationer, idet allelerne adskiller sig på et hvilket som helst givet sted let kan beregne de forventede genotypefrekvenser i den population. Dette kaldes Hardy-Weinberg-loven eller kaldes ofte som lov for befolkningsligevægt.

Når vi kender frekvenserne af allellerne i befolkningen, er det muligt at beregne de frekvenser, som genotypen vil være til stede i afkom fra den generation. Befolkningen af ​​seksuelt reproducerende diploide organismer på et locus med to alleler ved frekvenser p og q, efter en generation af tilfældig parring, ville frekvenserne af genotypen være AA, Aa og aa vil være p 2, 2pq, q 2 .

Lad os tage et eksempel på, at to alleler af genet AA dominerer mens aa dvs. allellerne er recessive gen. Ifølge Mendel's arvslove ville genotypeforholdet være 25% AA (homozygot dominant), 50 ville være Aa (heterozygot) og 25% ville være aa (homozygot recessiv).

Den statistiske formel for denne lov er p 2 + 2pq + q 2 . Ifølge Mendels love skal følgende være en genetisk kombination.

Dette viser, at alleler forbliver konstante fra generation til generation.

Anvendelsen af ​​chi-square test er lidt anderledes, når der ansøges om Hardy-Weinberg lov, fordi den beskæftiger sig med frekvenser af forventet genotype i stedet for tal. Graden af ​​frihed er taget n-2 i stedet for n-1.