Metoden för minsta kvadrat är en av de viktigaste applikationerna i tillnärmningen av funktioner. Tanken är att hitta en kurva så att, med tanke på en uppsättning beställda par, den här funktionen bäst tillnärmer sig data. Funktionen kan vara en linje, en kvadratisk kurva, en kubik etc.
Idén med metoden består av att minimera summan av kvadrater av skillnaderna i ordinaten (Y-komponenten), mellan punkterna som genereras av den valda funktionen och punkterna som tillhör datauppsättningen.

Minst kvadratmetod
Innan vi ger metoden måste vi först vara tydliga på vad "bättre tillvägagångssätt" innebär. Anta att vi letar efter en linje y = b + mx som bäst representerar en uppsättning av n-punkter, nämligen {(x1, y1), (x2, y2) …, (xn, yn)}.

Som visas i föregående figur, om variablerna x och y var relaterade till linjen y = b + mx, för motsvarande x = x1, skulle motsvarande värde på y vara b + mx1. Detta värde skiljer sig dock från det verkliga värdet på y, vilket är y = y1.
Kom ihåg att avståndet mellan två punkter i planet ges med följande formel:

Med detta i åtanke, för att bestämma sättet att välja raden y = b + mx som bäst motsvarar den givna datan, verkar det logiskt att använda som kriterium valet av linjen som minimerar summan av kvadraten på avståndet mellan punkterna och det raka.
Eftersom avståndet mellan punkterna (x1, y1) och (x1, b + mx1) är y1- (b + mx1), minskar vårt problem att hitta siffrorna m och b så att följande summa är minimal:

Linjen som uppfyller detta villkor kallas «tillnärmning av linjen med minsta kvadrat till punkterna (x1, y1), (x2, y2), …, (xn, yn)».
När problemet har uppnåtts återstår det bara att välja en metod för att hitta minsta kvadraters approximation. Om punkterna (x1, y1), (x2, y2), …, (xn, yn) alla är på linjen y = mx + b, skulle vi ha att de är kollinära y:

I detta uttryck:

Slutligen, om punkterna inte är kollinära, kan y-Au = 0 och problemet översättas till att hitta en vektor u så att den euklidiska normen är minimal.

Att hitta minimeringsvektorn u är inte så svårt som du kanske tror. Eftersom A är en nx2 matris och u är en 2 x 1 matris, har vi att vektorn Au är en vektor i R n och tillhör bilden av A, som är ett underrum av R n med en dimension som inte är större än två.
Vi antar att n = 3 för att visa vilken procedur vi ska följa. Om n = 3 kommer bilden av A att vara ett plan eller en linje genom ursprunget.

Låt v vara den minimerande vektorn. I figuren observerar vi att y-Au minimeras när den är vinkelrät mot bilden av A. Det vill säga, om v är den minimerande vektorn, så händer det att:

Sedan kan vi uttrycka ovanstående på detta sätt:

Detta kan bara hända om:

Slutligen, för att lösa för v, har vi:

Det är möjligt att göra detta eftersom A t A är inverterbar så länge de n punkter som anges som data inte är kollinära.
Om vi i stället för att leta efter en linje ville hitta en parabola (vars uttryck skulle ha formen y = a + bx + cx 2 ) som skulle vara en bättre tillnärmning till n datapunkter, skulle proceduren vara som beskrivs nedan.
Om n datapunkterna var i denna parabola, skulle vi ha:

Sedan:

På liknande sätt kan vi skriva y = Au. Om alla punkter inte finns i parabolen, har vi att y-Au skiljer sig från noll för någon vektor u och vårt problem är igen: hitta en vektor u i R3 så att dess norm - y-Au-- är så liten som möjligt .
Genom att upprepa det föregående förfarandet kan vi komma fram till att den sökta vektorn är:

Lösta övningar
Övning 1
Hitta den linje som bäst passar punkterna (1,4), (-2,5), (3, -1) och (4,1).
Lösning
Vi måste:

Sedan:


Därför drar vi slutsatsen att den linje som bäst passar poängen ges av:

Övning 2
Anta att ett föremål tappas från en höjd av 200 m. När det faller, vidtas följande steg:

Vi vet att höjden på nämnda objekt, efter en tid t har gått, ges av:

Om vi vill få värdet på g kan vi hitta en parabola som är en bättre tillnärmning till de fem punkterna som anges i tabellen, och därmed skulle vi ha att koefficienten som åtföljer t 2 kommer att vara en rimlig tillnärmning till (-1/2) g om mätningarna är korrekta.
Vi måste:

Och senare:


Så datapunkterna är anpassade till följande kvadratiska uttryck:

Så du måste:

Detta är ett värde som är rimligt nära rätt, vilket är g = 9,81 m / s 2 . För att få en mer exakt tillnärmning av g skulle det vara nödvändigt att utgå från mer exakta observationer.
Vad är det för?
I de problem som uppstår inom natur- eller samhällsvetenskapen är det bekvämt att skriva förhållandena som finns mellan olika variabler med hjälp av något matematiskt uttryck.
Till exempel i ekonomi kan vi relatera kostnad (C), inkomst (I) och vinster (U) med hjälp av en enkel formel:

I fysiken kan vi relatera accelerationen orsakad av tyngdkraften, den tid ett objekt har fallit och objektets höjd genom lag:

I föregående uttryck s o är den initiala höjden av nämnda föremål och v o är dess utgångshastighet.
Men att hitta formler som dessa är inte en lätt uppgift; det är vanligtvis upp till den yrkesmässiga som är på tjänst att arbeta med mycket data och upprepade gånger utföra flera experiment (för att kontrollera att de erhållna resultaten är konstant) för att hitta samband mellan olika data.
Ett vanligt sätt att uppnå detta är att representera de data som erhållits i ett plan som punkter och leta efter en kontinuerlig funktion som optimalt motsvarar dessa punkter.
Ett av sätten att hitta den funktion som "bäst approximerar" den givna informationen är med metoden för minsta kvadrat.
Som vi också såg i övningen kan vi tack vare den här metoden få ganska nära tillnärmningar till fysiska konstanter.
referenser
- Charles W Curtis Linear Algebra. Springer-Velarg
- Kai Lai Chung. Elementarförmågansteori med stokastiska processer. Springer-Verlag New York Inc
- Richar L Burden & J.Douglas Faires. Numerisk analys (7ed). Thompson Learning.
- Stanley I. Grossman. Tillämpningar av linjär algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO
- Stanley I. Grossman. Linjär algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO
