Suunnattu derivaatta

Suunnatun derivaatan idea kahden muuttujan funktiolla. Piste A sijaitsee ( x , y ) {\displaystyle (x,y)} -koordinaatistossa, jossa sen kautta on piirretty punaisen suoran avulla näkyviin suunta h {\displaystyle h} . Suoran kautta piirretään z {\displaystyle z} -akselin suuntainen taso, joka leikkaa funktion kuvaajaa esittävältä pinnalta keltaisen käyrän. Käyrää sivuaa tangentti pisteessä A ja tangentin jyrkkyys vaakatasoon nähden on funktion suunnatun derivaatan suuruinen.

Suunnattu derivaatta on matematiikassa usean muuttujan funktion derivaatta annetun vektorin suunnassa ja annetussa kohdassa. Muutosnopeuden suuruus voidaan parhaiten arvioida derivaatan avulla, joka määritellään niin, että tarkastelun suunta tulee huomioiduksi. Usean muuttujan funktion arvojen muutosnopeus muuttuu siirryttäessä eri suuntiin. Siksi erotukseksi yhden muuttujan funktioista, joilla on jokaisessa kohdassa yksi derivaatan arvo, usean muuttujan suunnatulla derivaatalla on jokaisessa pisteessä ääretön määrä derivaatan arvoja, jotka riippuvat tarkastelusuunnasta. Suunnatulla derivaatalla on sovelluksia enimmäkseen tieteen ja tekniikan aloilla.[1][2][3]

Yhden muuttujan reaalifunktiolla suunnattua derivaattaa vastaa toispuoleinen derivaatta, joka voidaan ottaa vasemmalta tai oikealta puolelta tarkastelupistettä.

Johdanto

Esimerkki

Yksinkertaisin usean muuttujan funktio on kahden muuttujan funktio f : R 2 R . {\displaystyle f:\mathbb {R} ^{2}\to \mathbb {R} .} Funktion muuttujia on tapana esittää joko koordinaattipareina tai kaksipaikkaisina vektoreina, joita kutsutaan pisteiksi. Funktion määrittelyjoukko on usein osajoukko x y {\displaystyle xy} -koordinaatiston pisteistä. Funktion arvot lasketaan jokaiselle koordinaatiston pisteelle ( x , y ) {\displaystyle (x,y)} erikseen ja kuvataan usein lisäämällä koordinaatistoon z {\displaystyle z} -ulottuvuus funktion arvoja varten. Silloin funktion käyttäytymistä voidaan esittää yhtälön z = f ( x , y ) {\displaystyle z=f(x,y)} avulla.

Funktion f ( x , y ) = x 2 + y 2 {\displaystyle f(x,y)=x^{2}+y^{2}} graafinen esitys yhtälön z = x 2 + y 2 {\displaystyle z=x^{2}+y^{2}} kuvaajana x y z {\displaystyle xyz} -koordinaatistossa. Kuvaajan huippu sijaitsee origon ( 0 , 0 ) {\displaystyle (0,0)} päällä. Piste ( 5 , 5 ) {\displaystyle (-5,5)} sijaitsee määrittelyalueen kulmauksessa taka-vasemmalla.
Funktion f ( x , y ) = x 2 + y 2 {\displaystyle f(x,y)=x^{2}+y^{2}} graafinen esitys yhtälöiden x 2 + y 2 = a {\displaystyle x^{2}+y^{2}=a} kuvaajina x y {\displaystyle xy} -koordinaatistossa. Kuvaajan huippu sijaitsee origon ( 0 , 0 ) {\displaystyle (0,0)} päällä. Piste ( 5 , 5 ) {\displaystyle (-5,5)} sijaitsee määrittelyalueessa nuolen kannan kohdalla. Oranssin vektorin pituus on suunnatun derivaatan arvo.

Esimerkkinä käytetään funktiota f ( x , y ) = x 2 + y 2 , {\displaystyle f(x,y)=x^{2}+y^{2},} joka on aina positiivinen lukuun ottamatta yhtä nollakohtaa origossa ( 0 , 0 ) {\displaystyle (0,0)} . Valitaan piste ( 5 , 5 ) {\displaystyle (-5,5)} , joka sijaitsee oheisen kuvaajan määrittelyalueen nurkkauksessa taka-vasemmalla, ja jossa funktio saa arvokseen f ( 5 , 5 ) = ( 5 ) 2 + 5 2 = 50. {\displaystyle f(-5,5)=(-5)^{2}+5^{2}=50.} Kuvaajasta päätellään, että funktiota esittävä pinta muistuttaa pullistunutta pussia, joka on sekä x {\displaystyle x} - että y {\displaystyle y} -akselin suhteen symmetrinen. Koska molemmat symmetriat ovat yhtä aikaa voimassa, on kuvaaja samalla z {\displaystyle z} -akselin suhteen symmetrinen ja muodostaa pyörähdyskappaleen pinnan. Pisteen ( 5 , 5 ) {\displaystyle (-5,5)} kohdalla on pinnan z {\displaystyle z} -koordinaatti 50. {\displaystyle 50.} Piirtämällä yhtälön x 2 + y 2 = 50 {\displaystyle x^{2}+y^{2}=50} kuvaaja x y {\displaystyle xy} -koordinaatistoon, muodostuu siihen ympyrä, jonka säde on 50 {\displaystyle {\sqrt {50}}} ja keskipisteenä origo. Koska tämän käyrän pisteissä ( x , y ) {\displaystyle (x,y)} funktio saa aina saman arvon 50 {\displaystyle 50} , kutsutaan sitä tasa-arvokäyräksi. Tasa-arvokäyrillä saa funktion arvoista tarkan kuvan, jos käyrät nimikoidaan niiden arviolla.

Funktion arvojen muutosnopeus näkyy x y z {\displaystyle xyz} -koordinaatistossa pinnan jyrkkyytenä. Jyrkkyys vaihtelee kuitenkin eri suunnissa. Jos vertaa funktion arvoja tasa-arvokäyrän suunnassa, on funktion arvon muutos nolla. Suurin muutosnopeus on origosta poispäin olevissa suunnissa (gradientti) ja pienin (negatiivinen) origoon päin olevissa suunnissa. Juuri tässä mielessä suunnattu derivaatta on tarpeellinen käsite, kun funktion muutosherkkyyttä eli derivaattaa määritellään eri suunnissa.

Käytännöllinen keino määrittää suunnattu derivaatta on laskea ensin gradientti. Gradientti on vektori, jonka arvo eli pituus on funktion suurin muutosnopeus kyseisessä pisteessä. Vektori myös osoittaa siihen suuntaan, missä muutosnopeus on suurimmillaan. Piirretään samaan pisteeseen suora, joka kulkee samaan suuntaan kuin suunnattu derivaatta tullaan määrittämään. Gradientin projektio tälle suoralle antaa sunnatun derivaatan arvon projektivektorin pituutena. Se voidaan laskea ottamalla gradientin arvosta kosini suoran ja gradientin välisestä kulmasta.

Esimerkkifunktion gradienttivektori lasketaan osittaisderivaatan avulla

f ( x , y ) = ( ( x 2 + y 2 ) x , ( x 2 + y 2 ) y ) = ( 2 x , 2 y ) , {\displaystyle \nabla f(x,y)=\left({\partial (x^{2}+y^{2}) \over \partial x},{\partial (x^{2}+y^{2}) \over \partial y}\right)=(2x,2y),}

jolloin vektorin arvoksi tulee f ( 5 , 5 ) = ( 2 ( 5 ) , 2 5 ) = ( 10 , 10 ) . {\displaystyle \nabla f(-5,5)=(2\cdot (-5),2\cdot 5)=(-10,10).} Valitaan derivaatan suunnaksi yksikkövektori u = ( 0 , 1 ) {\displaystyle u=(0,1)} , jolloin suunnatun derivaatan f u {\displaystyle f'_{u}} arvoksi saadaan vektorien pistetulon avulla ( 0 , 1 ) f ( 5 , 5 ) = ( 0 , 1 ) ( 10 , 10 ) = 10 {\displaystyle (0,1)\cdot \nabla f(-5,5)=(0,1)\cdot (-10,10)=10}

eli

f u ( 5 , 5 ) = 10. {\displaystyle f'_{u}(-5,5)=10.}

Merkintöjä

Suunnattu derivaatta merkitään monella eri tavalla. Pisteessä a {\displaystyle a} ja suunnassa u {\displaystyle u} määritetty funktion f {\displaystyle f} suunnattu derivaatta voidaan merkitä seuraavilla tavoilla:[2][4]

D u f ( a ) = f u ( a ) = f u ( a ) = u f ( a ) = u f ( a ) = v f ( x ) = v f ( x ) x , {\displaystyle D_{u}f(\mathbf {a} )=f'_{u}(\mathbf {a} )={\partial f \over \partial u}(\mathbf {a} )=\partial _{u}f(\mathbf {a} )=\nabla _{u}f(\mathbf {a} )=\mathbf {v} \cdot {\nabla f(\mathbf {x} )}=\mathbf {v} \cdot {\frac {\partial f(\mathbf {x} )}{\partial \mathbf {x} }},}

missä merkityt kertolaskut ovat vektorien pistetuloja.

Määritelmä

Usean muuttujan funktion f : R n R {\displaystyle f:\,\mathbb {R} ^{n}\to \mathbb {R} } määrittelyjoukko voidaan ajatella koostuvan usean muuttujan pisteistä tai vektoreista x = ( x 1 , x 2 , , x n ) {\displaystyle \mathbf {x} =(x_{1},x_{2},\ldots ,x_{n})} , jolloin merkitään x R n {\displaystyle \mathbf {x} \in \mathbb {R} ^{n}} (lihavoidut suureet ovat pisteitä ja vektoreita). Kun halutaan laskea funktion arvoja pisteessä a R n {\displaystyle \mathbf {a} \in \mathbb {R} ^{n}} , joka sijaitsee pisteestä x {\displaystyle \mathbf {x} } lähtevän yksikkövektorin u R n {\displaystyle \mathbf {u} \in \mathbb {R} ^{n}} suunnassa, kirjoitetaan f ( a ) = f ( x + k u ) , {\displaystyle f(\mathbf {a} )=f(\mathbf {x} +k\mathbf {u} ),} missä k R {\displaystyle k\in \mathbb {R} } . Funktion arvojen muutosnopeus pisteen x 0 {\displaystyle \mathbf {x_{0}} } ympäristössä ja suunnassa u {\displaystyle \mathbf {u} } muodostetaan erotusosamäärän avulla, jonka raja-arvona saadaan haluttu derivaatta

f u ( x 0 ) = lim h 0 f ( x 0 + h u ) f ( x 0 ) h . {\displaystyle f'_{u}(\mathbf {x_{0}} )=\lim _{h\rightarrow 0}{\frac {f(\mathbf {x_{0}} +h\mathbf {u} )-f(\mathbf {x_{0}} )}{h}}.} [4]

Yhteys gradienttiin

Funktion gradientti f ( a ) {\displaystyle \nabla f(\mathbf {a} )} (lue "nabla f") on vektori, joka osoittaa kussakin pisteessä a {\displaystyle \mathbf {a} } siihen suuntaan, missä funktion suunnattu derivaatta f u ( a ) {\displaystyle f'_{u}(\mathbf {a} )} saa suurimman arvonsa. Silloin suunnatun derivaatan arvo on yhtä suuri kuin gradientin itseisarvo eli f u ( a ) = | f ( a ) | {\displaystyle f'_{u}(\mathbf {a} )=|\nabla f(\mathbf {a} )|} . Suunnattu derivaatta voidaan laskea yksikkövektorin ja gradientin vektorien pistetulon avulla [5][6][4]

f u ( a ) = u f ( a ) = | f ( a ) | cos α , {\displaystyle f'_{u}(\mathbf {a} )=\mathbf {u} \cdot \nabla f(\mathbf {a} )=|\nabla f(\mathbf {a} )|\cos \alpha ,}

missä α {\displaystyle \alpha } on yksikkövektorin ja gradientin välinen kulma. Gradienttia käyttämällä saadaan helpoin tapa määrittää suunnatun derivaatan arvo.[6]

Gradientti lasketaan ottamalla funktiosta osittaisderivaatat kunkin muuttujan suhteen erikseen ja järjestämällä tulokset muuttujien mukaiseen järjestykseen vektoriksi [7]

f ( a ) = ( f ( a ) x 1 , f ( a ) x 2 , f ( a ) x 3 , , f ( a ) x n ) . {\displaystyle \nabla f(a)=\left({\frac {\partial f(a)}{\partial x_{1}}},{\frac {\partial f(a)}{\partial x_{2}}},{\frac {\partial f(a)}{\partial x_{3}}},\dots ,{\frac {\partial f(a)}{\partial x_{n}}}\right).} [4]

Ominaisuuksia

Suunnatun derivaatan ominaisuuksia, kun derivaatta on otettu suunnassa v {\displaystyle \mathbf {v} } :

Funktioiden summa:

v ( f + g ) = v f + v g {\displaystyle \nabla _{\mathbf {v} }(f+g)=\nabla _{\mathbf {v} }f+\nabla _{\mathbf {v} }g}

Vakiovektorin sääntö:

v ( c f ) = c v f {\displaystyle \nabla _{\mathbf {v} }(cf)=c\nabla _{\mathbf {v} }f}

Funktioiden tulon sääntö:

v ( f g ) = g v f + f v g {\displaystyle \nabla _{\mathbf {v} }(fg)=g\nabla _{\mathbf {v} }f+f\nabla _{\mathbf {v} }g}

Ketjusääntö: Jos g on differentioituva pisteessä p and h on differentioituva pisteessä g(p), silloin

v ( h g ) ( p ) = h ( g ( p ) ) v g ( p ) {\displaystyle \nabla _{\mathbf {v} }(h\circ g)(\mathbf {p} )=h'(g(\mathbf {p} ))\nabla _{\mathbf {v} }g(\mathbf {p} )}

Toispuoleiset suunnatut derivaatat

Toispuoleiset derivaatat funktiolle f : U R {\displaystyle f\colon {U}\rightarrow \mathbb {R} } suunnassa v R n {\displaystyle v\in \mathbb {R} ^{n}} , missä U R n {\displaystyle U\subseteq \mathbb {R} ^{n}} , voidaan määritellä

D v + f ( x ) = lim h 0 , h > 0 f ( x + h v ) f ( x ) h {\displaystyle D_{v}^{+}{f(x)}=\lim _{h\rightarrow 0,\,h>0}{\frac {f(x+h\cdot v)-f(x)}{h}}}
D v f ( x ) = lim h 0 , h < 0 f ( x + h v ) f ( x ) h = D v + f ( x ) . {\displaystyle D_{v}^{-}{f(x)}=\lim _{h\rightarrow 0,\,h<0}{\frac {f(x+h\cdot v)-f(x)}{h}}=-D_{-v}^{+}f(x).}

Suunnattu derivaatta suunnassa v {\displaystyle v} on olemassa, kun toispuoleiset suunnatut derivaatat D v + f ( x ) {\displaystyle D_{v}^{+}{f(x)}} ja D v f ( x ) {\displaystyle D_{v}^{-}{f(x)}} ovat samanarvoiset. Tällöin pätee

D v f ( x ) = D v + f ( x ) = D v f ( x ) . {\displaystyle D_{v}{f(x)}=D_{v}^{+}{f(x)}=D_{v}^{-}{f(x)}.}

Lähteet

Viitteet

  1. Weisstein, Eric W.: Derivative (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  2. a b Weisstein, Eric W.: Directional Derivative (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  3. Helsingin yliopisto: Matematiikan tukikurssi, s. 1–4, 2010
  4. a b c d Hästö, Peter (Arkistoitu – Internet Archive): Analyysi II (Arkistoitu – Internet Archive), s. 31–33, Oulun yliopisto, 2007
  5. Weisstein, Eric W.: Gradient (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  6. a b Kangaslampi, R.: Osittaisderivaatta 1[vanhentunut linkki], 2012
  7. Weisstein, Eric W.: Partial Derivative (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)

Kirjallisuutta

  • Pitkäranta, Juhani: Calculus Fennicus. Helsinki: Avoimet oppimateriaalit ry, 2015. ISBN 978-952-7010-12-9.

Aiheesta muualla

  • Heikki P.: Gradientti ja suunnatut derivaatat (Arkistoitu – Internet Archive)
  • Kangaslampi, R.: 6. Osittaisderivaatta 1[vanhentunut linkki], Osittaisderivaatta 2[vanhentunut linkki], 2012
  • Silvennoinen, Risto: Luku 3. Raja-arvot. Osittaisderivaatat. (Arkistoitu – Internet Archive), 2010
  • Turunen, E.: Differentiaalilaskentaa (viikko4) (Arkistoitu – Internet Archive)
  • Hirvensalo, Mika: Insinöörimatematiikka IIB 2012 (Arkistoitu – Internet Archive)
  • Long, Kevin: Math 5311 – Gateaux differentials and Frechet derivatives, 2009