introduccionalafisica.files.wordpress.com€¦ · 1 | UNIVERSIDAD NACIONAL DE MAR DEL PLATA...
Transcript of introduccionalafisica.files.wordpress.com€¦ · 1 | UNIVERSIDAD NACIONAL DE MAR DEL PLATA...
-
1
|
UNIVERSIDAD NACIONAL DE MAR DEL PLATA FACULTAD DE CIENCIAS EXACTAS Y NATURALES
DEPARTAMENTO DE FÍSICA
Licenciatura/Profesorado en Física
_____________________________________________
Cátedra: Introducción a la Física
Lecciones populares de Matemática
básica aplicada Santiago Ramírez-Zivano y Julián Amaya
____________________________________________
Teoría de conjuntos
Introducción
La teoría de conjuntos más elemental es una de las herramientas básicas del lenguaje matemático. Dados unos elementos, unos objetos matemáticos como números o polígonos por ejemplo, puede imaginarse una colección
determinada de estos objetos, un conjunto. Cada uno de estos elementos pertenece al conjunto, y esta noción de pertenencia es la relación relativa a
conjuntos más básica. Los propios conjuntos pueden imaginarse a su vez
-
2
como elementos de otros conjuntos. La pertenencia de un elemento a a un conjunto A se indica como a ∈A. Una relación entre conjuntos derivada de la relación de pertenencia es la
relación de inclusión. Una subcolección de elementos B de un conjunto dado A es un subconjunto de A, y se indica como B ⊆A.
Ejemplos
-Los conjuntos numéricos usuales en matemáticas son: el conjunto de los números naturales N, el de los números enteros Z, el de los números
racionales Q, el de los números reales R y el de los números complejos C. Cada uno es subconjunto del siguiente:
N ⊂ Z ⊂ Q ⊂ R ⊂ C
-El espacio tridimensional E3 es un conjunto de objetos elementales
denominados puntos p, p ∈E3. Las rectas r y planos α son conjuntos de puntos a su vez, y en particular son subconjuntos de E3, r ⊆E3 y α⊆E3.
Algebra de conjuntos
-Unión. La unión de dos conjuntos A y B es el conjunto A∪B que contiene cada elemento que está por lo menos en uno de ellos. -Intersección. La intersección de dos conjuntos A y B es el conjunto A∩B que contiene todos los elementos comunes de A y B. -Diferencia. La diferencia entre dos conjuntos A y B es el conjunto A\B que contiene todos los elementos de A que no pertenecen a B.
-Complemento. El complemento de un conjunto A es el conjunto Ac que contiene todos los elementos (respecto de algún conjunto referencial U) que no pertenecen a A. Ac=U-A -Diferencia simétrica. La diferencia simétrica de dos conjuntos A y B es el conjunto AΔB con todos los elementos que pertenecen, o bien a A, o bien a B, pero no a ambos a la vez. -Producto cartesiano. El producto cartesiano de dos conjuntos A y B es el conjunto A×B que contiene todos los pares ordenados (a,b) cuyo primer elemento a pertenece a A y su segundo elemento b pertenece a B.
-
3
La relación de inclusión tiene las mismas propiedades que la relación de orden
no estricto: es reflexiva (A⊆A); transitiva (A⊆B y B⊆C implican A⊆C); y antisimétrica (A⊆B y B⊆A implican A=B).
Sistema de coordenadas
Producto Cartesiano
En matemáticas, el producto cartesiano de dos conjuntos es una
operación que tiene como resultado a otro conjunto, cuyos elementos son
todos los pares ordenados que pueden formarse de manera que el primer
elemento del par pertenezca al primer conjunto y el segundo elemento al
segundo conjunto. Sean A={a1,…,an} y B={b1,…,bm}, se define producto
cartesiano entre A y B a: AxB={(ai,bj) / aiϵA y bjϵ B}
“El producto cartesiano AxB es el conjunto formado por los pares ordenados
(ai,bj) tales que ai pertenece a A y bi pertenece a B”.
En general, dado un número finito de conjuntos A1,…,An, su producto
cartesiano se define como A1x…..xAn={(a1,….,an)/ a1ϵA1,…,anϵAn}. Los
elementos (a1,….,an) del conjunto A1x…..xAn se denominan n-tuplas. Una n-
tupla es una secuencia o lista ordenada de n elementos con nϵN. El producto
cartesiano no es conmutativo AxB ≠ BxA, ni asociativo (AxB)xC≠Ax(BxC). En
particular si los productos son entre R se obtiene Rx…..xR= Rn. Por ejemplo:
RxRxR=R3
Función coordenada
Al espacio real ∑ donde se llevan a cabo los procesos físicos es necesario
asignarle un espacio abstracto Rn en el que se pueden describir
matemáticamente los procesos en cuestión. En geometría, un punto en un
sistema de coordenadas puede estar descripto por una tupla, i.e., un conjunto
-
4
ordenado de números en el que cada uno de ellos está referido a la posición
sobre un eje coordenado. El proceso por el cual se asigna a cada punto del
espacio físico real un punto del espacio abstracto se realiza a través de la
función de coordenadas
Φ: ∑ → Rn / Φ(p) = (xp1,…,xpn)
donde (xp1,…,xpn) representa las coordenadas del punto en el espacio Rn obtenido
a partir de p por Φ.
Hay diferentes tipos de sistemas de coordenadas. Entre los más conocidos
están: las coordenadas cartesianas, que se utilizan en espacios como la recta,
el plano Euclídeo, el espacio tridimensional y de más dimensiones; las
coordenadas polares (utilizadas en el plano Euclídeo); las coordenadas
esféricas; las coordenadas cilíndricas; sistemas de coordenadas curvilíneas;
etc. (El término Euclídeo se definirá con precisión más adelante.)
Coordenadas cartesianas
En Física, un sistema de coordenadas que describe puntos en el espacio recibe
el nombre de sistema de referencia. En un espacio Euclídeo, un sistema de
coordenadas cartesianas se define por n ejes ortogonales igualmente
escalados. El valor de la i-ésima coordenada del punto P es igual a la
proyección ortogonal del punto sobre el i-ésimo eje coordenado.
-
5
En la figura, las coordenadas del punto p vienen dadas por la 3-tupla (xp1, xp2,
xp3).
Coordenadas polares
En este sistema de coordenadas bidimensionales, cada punto del plano se
determina por una distancia y un ángulo. Este consta de un punto O del plano
al que se llama polo, y una semirrecta dirigida que tiene origen en O llamada
Eje polar, equivalente al eje x del sistema cartesiano. Todo punto P del plano
corresponde a un par ordenado P≡(r,θ) donde r es la distancia de P al origen y
θ es el ángulo formado entre el eje polar y la semirrecta dirigida OP que va
de O a P. El valor de θ crece en sentido antihorario. La coordenada r (r>0) se
conoce como coordenada radial o radio vector mientras que al ángulo se lo
conoce como ángulo polar. Para O, que es un punto situado en el origen, r=0
y θ queda indefinido. Se adopta como convención representar a O como
O≡(0,0).
Definido un punto en coordenadas polares, se pueden obtener coordenadas
cartesianas a partir de x = r cosθ e y = r senθ. Si el punto del plano está dado
en coordenadas rectangulares (x,y), la coordenada polar r es: r = √𝑥2 + 𝑦2 y
θ=arc tan(x/y).
Los sistemas con simetría radial poseen características adecuadas para el
sistema de coordenadas radiales ó polares, por ejemplo, el problema de los
dos cuerpos regidos por un campo gravitatorio que obedece la ley del cuadrado
inverso. En efecto, dado que la relación entre fuerza F y distancia r entre las
masas depende solo de la coordenada r, las coordenadas polares son las más
adecuadas para describir los fenómenos relacionados con esta simetría.
Coordenadas cilíndricas
El sistema de coordenadas cilíndricas es muy conveniente en aquellos casos
en que se tratan problemas que tienen simetría de tipo cilíndrico o azimutal. Se trata de una versión en tres dimensiones de las coordenadas polares de la geometría analítica plana.
El sistema de coordenadas cilíndricas utiliza como base el sistema de coordenadas polares en 2D proyectado hacia el espacio usando la coordenada
-
6
z del sistema de coordenadas cartesianas. En este sistema las coordenadas x e y son reemplazadas por un vector de R3 dirigido a la
proyección del punto sobre el plano XY cuya magnitud es igual a la distancia del punto al eje z (coordenada r), la cual es la primera coordenada del sistema. El ángulo de dirección de dicho vector medido con respecto al
semieje x positivo constituye la segunda coordenada del sistema (coordenada y la tercera coordenada coincide con la coordenada z del sistema cartesiano (r,z). En la Figura pueden observarse las tres coordenadas asociadas a un punto en el sistema cilíndrico de coordenadas. Un punto en este sistema de
coordenadas se designa como P≡(r,z), y los rangos de variación de las tres coordenadas son:
0≤r
-
7
Coordenadas esféricas
En el sistema de coordenadas esféricas se utilizan también tres coordenadas para notar la posición de un punto P o un vector en un espacio tridimensional, dos de estas coordenadas son angulares y una de ellas es métrica.
Se utiliza la longitud de un vector que une el origen de coordenadas con punto dado. Al ángulo que este vector forma con el semieje z positivo se lo
rotula en la literatura como y al ángulo que forma la proyección de sobre el plano XY con el semieje X positivo, tal como se muestra en la Figura. Los ángulos y toman los nombres de ángulo azimutal y ángulo cenital respectivamente y un punto en este sistema de coordenadas se designa como P≡(,). En el sistema internacional, los rangos de variación de las tres coordenadas son:
02π ; 0π
Las líneas coordenadas son aquellas que se obtienen variando una de las coordenadas y manteniendo fijas las otras dos. Para las coordenadas esféricas,
estas son: -Líneas coordenadas ρ: Semirrectas radiales partiendo del origen de coordenadas. -Líneas coordenadas ϕ: Semicírculos verticales (meridianos).
-Líneas coordenadas θ: Circunferencias horizontales (paralelos).
Las superficies coordenadas son aquellas que se obtienen fijando sucesivamente cada una de las coordenadas de un punto. Para este sistema
son:
-
8
-Superficies ρ=cte.: Esferas con centro en el origen de coordenadas. -Superficies θ=cte.: Conos rectos con vértice en el origen. -Superficies ϕ=cte.: Semiplanos verticales.
Las líneas y superficies coordenadas de este sistema son perpendiculares dos a dos en cada punto. Por ello, éste es un sistema ortogonal.
Relación con las coordenadas cartesianas
Sobre los conjuntos abiertos:
U = {(;;) / >0; 0
-
9
V ó 𝑉→
Por ejemplo, E, v, ω representan respectivamente las magnitudes vectoriales
de módulos E, v y ω. El módulo de una magnitud vectorial también se
representa encerrando entre barras al correspondiente vector:
│𝐸→
│, │𝑣→│y │𝜔
→│.
En la literatura usual, es costumbre hallar los términos “origen ó punto de
aplicación’’ y “extremo libre’’ que están referidos al origen del segmento
orientado y a la punta de flecha del mismo respectivamente.
Un vector en Rn también queda descripto por una n-tupla X=(x1,x2,......,xn)
donde los números xj ϵ R representan las coordenadas del vector. Un concepto
importante que el alumno debe internalizar, es justamente la notación de la
n-tupla. Para dar un ejemplo concreto, supongamos un espacio Euclídeo
tridimensional R3. La terna (1,3,2) sirve para representar dos cosas: el punto
P del espacio que tiene coordenadas (1,3,2) y también al vector P que tiene
origen en el origen de coordenadas y su extremo libre en el punto (1,3,2), es
decir P≡(1,3,2) y P=(1,3,2).
En geometría analítica es común trabajar con superficies, planos, curvas y
rectas en el espacio. Vamos a introducir el concepto de transporte paralelo de
un vector. Sea un espacio Euclídeo R3, un plano π, un punto P≡(Px,Py,Pz) / Pϵ π y
sea n=(nx,ny,nz) un vector normal al plano cuyo origen está en P. Dijimos más
arriba que los vectores son representados con su origen en el origen de
-
10
coordenadas, sin embargo en este caso concreto, el origen de n está en el
punto P que pertenece al plano. Entonces, ¿cómo interpretamos las
coordenadas del vector n?
Definición: Si un vector es trasladado en forma paralela, es decir que la
posición final del vector es paralela al vector original, se dice que sus
coordenadas permanecen invariantes.
Las coordenadas del vector n están dadas en el origen de coordenadas, sin
embargo podemos trasladarlo paralelamente hasta el punto P conservando
sus propiedades. El “nuevo’’ vector n ahora está en el punto P pero sus
coordenadas siguen siendo las mismas.
Se puede establecer un vector orientando un segmento en el espacio. Sean dos
puntos P≡(p1,…,pn) y Q≡(q1,…,qn)/ P y Q ϵ Rn. Entonces:
PQ=(q1-p1,…,qn-pn) y QP=(p1-q1,…,pn-qn).
Ejemplo: Sean P≡(2,1) y Q≡(4,5) entonces PQ=(4-2,5-1)=(2,4) y QP=(2-4,1-5)
=(-2,-4)
La distancia entre dos puntos P≡(p1,…,pn) y Q≡(q1,…,qn) en un espacio
Euclídeo se puede calcular por la función distancia:
δ: Rn → R / δ(P,Q)=√(𝑞1 − 𝑝1)2+. . . +(𝑞𝑛 − 𝑝𝑛)2 = √∑ (𝑞𝑗 − 𝑝𝑗)2𝑛
𝑗=1
Notar que δ es conmutativa δ(P,Q)=δ(Q,P)>0.
-
11
Operaciones entre vectores (modo gráfico)
La suma gráfica de vectores se puede realizar por varios métodos, pero el más
usado es el método de la poligonal. Este consiste en dejar un vector fijo y a
continuación se toma otro vector cualquiera, se lo traslada paralelamente
hasta que su origen coincida con el extremo libre del vector que se dejó fijo. El
proceso se repite hasta que todos los vectores queden conectados formando
una poligonal. El vector que se forma uniendo el origen del primer vector con
el extremo libre del último se llama vector resultante, y su acción es
equivalente a la acción que realiza el conjunto de vectores anteriores actuando
todos simultáneamente.
Usando este método se puede calcular la resultante de por ejemplo:
a+½b-c+2d
Cuando un vector se halla multiplicado por un coeficiente k≠1, el módulo del
vector se dilata si │k│>1 y se contrae si │k│0. El cálculo se resume a una suma a+½b+(-c)+2d.
Espacios vectoriales
En principio, un espacio vectorial es una estructura algebraica creada a partir
de un conjunto no vacío, una operación interna (llamada suma, definida para
los elementos del conjunto) y una operación externa (llamada producto por un
-
12
escalar, definida entre dicho conjunto y otro conjunto llamado cuerpo). A los
elementos del conjunto se los llama vectores y a los elementos del cuerpo,
escalares. Al espacio vectorial lo denotaremos V y al cuerpo K.
Un espacio vectorial sobre un cuerpo K (Reales ó Complejos) es un conjunto V
no vacío, dotado de dos operaciones para las cuales es cerrado, es decir, el
resultado está en V.
Operación interna: Suma
+: V x V → V / (u,v)→ w = u+v
Posee las siguientes propiedades:
(S1) Propiedad conmutativa: u+v = v+u, ∀u,vϵV
(S2) Propiedad asociativa: (u+v)+w = u+(v+w), ∀u,v,wϵV
(S3) Elemento neutro (de la suma): ∃ eϵV / u+e = u, ∀ uϵV
(S4) Elemento opuesto (de la suma): ∃ -uϵ V/ u+(-u) = e, ∀uϵV
Operación externa: Producto por un escalar
(P1) Propiedad asociativa: a(bu) = (ab)u, ∀uϵV y ∀a,bϵK
(P2) Existencia de elemento neutro e del cuerpo K (1 en los reales): ∃ eϵV/
eu = u, ∀ uϵV.
(P3) Propiedad distributiva del producto respecto de la suma de vectores:
a(u+v) = au+av, ∀ aϵK y ∀ u,vϵV.
(P4) Propiedad distributiva del producto respecto de la suma de escalares:
(a+b)u = au+bu, ∀ a,bϵK y ∀ uϵV.
Ejemplo: Se quiere probar que R2 es un espacio vectorial sobre R.
Si R2 juega el papel de V y R el de K, los elementos uϵV=R2=RxR son, de forma
genérica, u = (ux; uy), es decir, pares de números reales. Por claridad se
conserva la denominación del vector, en este caso u, en sus coordenadas,
añadiendo el subíndice x o y para denominar su componente en el eje x o y
respectivamente. En V se define la operación suma:
+ : V x V → V / (u ; v) → w = u + v
donde u=(ux; uy), v=(vx; vy), w=(wx;wy) y la suma de u y v es:
u+v = (ux;uy) + (vx;vy) = (ux+vx;uy+vy) = (wx;wy) = w
-
13
donde wx= ux+ vx, wy= uy+ vy. Esto implica que la suma de vectores es interna
y bien definida.
La operación interna suma tiene las propiedades:
1) Propiedad conmutativa: u + v = v + u; ∀ u,vϵV u + v = (ux;uy) + (vx;vy) = (ux+vx;uy+vy) = (vx+ux;vy+uy) = (vx;vy) + (ux;uy) = v + u
2) Propiedad asociativa: (u + v) + w = u + (v + w)
(u + v) + w = (ux+vx;uy+vy) + (wx;wy) = (ux+vx+wx;uy+vy+wy) =
= (ux+(vx+wx);uy+(vy+wy))= (ux;uy)+(vx+wx;vy+wy)=(ux;uy)+((vx;vy)+(wx;wy))= = u + (v + w)
3) Elemento neutro 0: u + 0 = u u = (ux; uy) + (0; 0) = (ux+ 0; uy+ 0) = (ux; uy) = u
4) Elemento opuesto:
u = (ux; uy), -u = (-ux;-uy)
u+(-u) = (ux;uy) + (-ux;-uy) = (ux-ux;uy-uy) = (0;0) = 0 La operación producto por un escalar:
K x V → V /(a; u) → v = au El producto de a y u será:
au = a(ux; uy) = (aux; auy) = (vx; vy) = v Donde vx=aux y vy=auy.
Esto implica que la multiplicación de vector por escalares externa está bien definida.
5) Tiene la propiedad asociativa: a(bu) = (ab)u; ∀ a,bϵK y ∀ uϵV
a(bu) = a(b(ux;uy)) = a(bux;buy) = (abux;abuy) = (ab)(ux;uy) = (ab)u
6) Sea 1ϵR elemento neutro en el producto: 1u = u; ∀ uϵV
1u = 1(ux;uy) = (1ux;1uy) = (ux;uy) = u
7) Propiedad distributiva por la izquierda: a(u + v) = au + av; ∀ aϵK y ∀ u,vϵV a(u + v) = a((ux;uy) + (vx;vy)) = a(ux+vx;uy+vy) =(aux+avx;auy+avy)=
= (aux;auy) + (avx;avy) = a(ux;uy) + a(vx;vy)= au + av
8) Propiedad distributiva por la derecha: (a + b)u= au + bu; ∀ a,bϵK y ∀ uϵV
(a + b)u = (a + b)(ux;uy) = ((a + b)ux; (a + b)uy) = (aux+bux;auy+buy)=
= (aux;auy) + (bux;buy) = a(ux;uy) + b(ux;uy) = au + bu
Queda demostrado entonces que V=R2es espacio vectorial en R.
Se puede demostrar que Rn es también es un espacio vectorial.
Dependencia e independencia lineal
-
14
Definición: sea un conjunto de vectores {vj} y un conjunto de escalares {kj}
con j=1,…,n. Se define combinación lineal de los elementos de {vj} a
k1v1+…+knvn
Sea Rn espacio vectorial con sus infinitos vectores (cada punto representa un
vector) y W={v1,…,vs} un subconjunto formado por s vectores de Rn. Se dice
que W es linealmente dependiente si existen escalares k1,…,ks no todos nulos
tal que:
k1v1+…+k2v2=0 o en forma abreviada ∑ 𝑘𝑗𝐯𝑗𝑠
𝑗=1=0
Esto significa que cualquiera de los vectores de W se puede escribir como una
combinación lineal de los otros vectores de W. Si por el contrario, la única
forma de escribir la igualdad anterior fuera que todos los kj sean cero,
entonces se dice que el subconjunto de vectores de W es linealmente
independiente. La independencia lineal en un conjunto W nos dice que el
vector nulo solo puede ser escrito como una combinación lineal de sus
elementos, solo si los coeficientes son 0. En la última ecuación, 0 representa
al vector nulo (0,…,0).
Ejemplos: 1) Sea R3 y W={(1,0,0),(0,1,0),(0,0,1)}⊂R3. ¿Es W linealmente
independiente? Llamemos v1=(1,0,0), v2=(0,1,0) y v3=(0,0,1). Entonces:
∃ k1, k2 y k3 / k1(1,0,0)+k2(0,1,0)+k3(0,0,1)=0
k1(1,0,0)+k2(0,1,0)+k3(0,0,1)=(k1,0,0)+(0,k2,0)+(0,0,k3)=(k1,k2,k3)=(0,0,0)
Como una igualdad entre vectores indica igualar componente a componente,
resulta k1=0, k2=0 y k3=0, i.e., W es linealmente independiente.
2) Sea R2 y W={(2,1),(-14,-7)}⊂R2. ¿Es W linealmente independiente?
k1(2,1)+k2(-14,-7)=(2k1,k1)+(-14k2,-7k2)=(2k1-14k2,k1-7k2)=(0,0)
Entonces debe cumplirse simultáneamente que 2k1-14k2=0 y k1-7k2=0. La
solución de este sistema de ecuaciones homogéneas (igualadas a cero) no es
única, es decir el sistema es compatible indeterminado, por lo tanto existen
infinitas soluciones que cumplen k1=7k2 (esto se desprende de ambas
ecuaciones). Si los kj cumplen esta relación (por ejemplo k1=5 y k2=5/7) se
podrá escribir k1(2,1)+k2(-14,-7)=0 sin ser todos los kj iguales a 0. Luego W es
linealmente dependiente.
Subespacio generado
-
15
Consideremos el espacio vectorial Rn. El subespacio W⊂Rn generado por un
conjunto no vacío de vectores de Rn, es el conjunto de todas las combinaciones
lineales de todos los vectores de dicho conjunto.
Ejemplo: El conjunto W={(1,0,0),(0,1,0),(0,0,1)} genera R3. R3 puede escribirse
como una combinación lineal de los vectores de W. En efecto, el vector (c1,c2,c3)
puede escribirse como c1(1,0,0)+c2(0,1,0)+c3(0,0,1). Nótese que todo vector de
Rn puede escribirse como una combinación lineal de los vectores de W.
Base de un espacio vectorial
Consideremos el espacio vectorial Rn. Una base B de Rn es un conjunto
linealmente independiente de Rn que genera Rn. Es decir, el subespacio
vectorial generado por B es Rn. Ya vimos que {(1,0,0),(0,1,0),(0,0,1)} es
linealmente independiente y además genera a R3, por lo tanto es una base de
R3. Esta base se la conoce como la base canónica de R3.
Dimensión de un espacio vectorial
Puede demostrarse que dos bases distintas de un mismo espacio vectorial
necesariamente tendrán la misma cantidad de vectores. Este hecho habilita
la definición de dimensión.
Sea V un espacio vectorial, llamaremos dimensión de V (dim(V)) al número de vectores que tiene una base cualquiera de V. Notar que: dim(Rn)=n.
Enunciaremos una proposición que puede demostrarse en forma general para cualquier espacio vectorial, y luego analizaremos su significado para Rn.
Sea V un espacio vectorial sobre el cuerpo K, B={v1,…,vn} una base ordenada (es decir, una base donde nos importa el orden de los vectores). Entonces existen y son únicos los escalares {kj}ϵK (j=1,…,n)para cada vector vϵV tales
que:
𝐯 = ∑ kj𝐯j
𝑛
𝑗=1
Consideremos a R3 y la base canónica {(1,0,0),(0,1,0),(0,0,1)}. Sean
v=k1(1,0,0)+k2(0,1,0)+k3(0,0,1) y v’=k’1(1,0,0)+k’2(0,1,0)+k’3(0,0,1). El resultado anterior establece que para dos vectores distintos de R3, los ki no
pueden ser idénticos a los k’i. Estos escalares ki forman una n-tupla que denominaremos coordenadas del vector v (ídem para ki’ y v’). Para definir el concepto de base ortonormal (bon), es necesario antes introducir los conceptos
de producto interno y, para nuestro estudio en Rn, el producto interno canónico (también conocido como producto escalar).
Producto interno en un espacio vectorial
-
16
Sea V un espacio vectorial sobre K (R ó C). Un producto interno en V es una
función 〈 , 〉 : V x V → R que cumple con las siguientes condiciones: (1) ∀ x,y,zϵV: 〈x+y,z〉 = 〈x,z〉 + 〈y,z〉. (2) ∀ x,yϵV, ∀ kϵR: 〈kx,y〉 = k〈x,y〉. (3) ∀ x,yϵV:〈x,y〉* = 〈y,x〉 donde (*) indica conjugación en C. (4) ∀ xϵV si x≠0, entonces 〈x,x〉>0.
Producto interno canónico
Consideremos el espacio vectorial Kn sobre el cuerpo K. Definimos el producto interno canónico:
〈 , 〉 ∶ Kn x Kn → K / < (𝑥1,...,𝑥𝑛), (𝑦1,...,𝑦𝑛) > = ∑ xj𝑦𝑗∗
𝑛
𝑗=1
Nos interesa el caso K=R. Probemos que el producto interno canónico cumple las 4 condiciones mencionadas anteriormente.
(1) Sean los siguientes vectores en Rn: x=(x1,…,xn), y=(y1,…,yn) y z=(z1,…,zn).
Entonces:
〈x+y,z〉 = 〈(x1,…,xn)+(y1,…,yn),(z1,…,zn)〉 = ∑ (xi + yi)zi𝑛
𝑖=1 =
= ∑(xizi + yizi)
𝑛
𝑖=1
= ∑ xizi
𝑛
𝑖=1
+ ∑ yizi
𝑛
𝑖=1
=
= 〈(x1,…,xn),(z1,…,zn)〉+〈(y1,…,yn),(z1,…,zn)〉 = 〈x,z〉+〈y,z〉 ⟹ 〈x+y,z〉=〈x,z〉+〈y,z〉 (2) Sean kϵR y x=(x1,…,xn), y=(y1,…,yn)ϵRn, entonces:
〈kx,y〉 = 〈k(x1,…,xn),(y1,…,yn)〉 = 〈(kx1,…,kxn),(y1,…,yn) = ∑ kx𝑖yi𝑛𝑖=1 =
= 𝑘 ∑𝑖=1
𝑛
xiyi = k〈(x1,…,xn),(y1,…,yn)〉 = k〈x,y〉
⟹ 〈kx,y〉= k〈x,y〉
(3) 〈x,y〉 = 〈(x1,…,xn), (y1,…,yn)〉 = ∑ x𝑖yi𝑛𝑖=1 = ∑ y𝑖xi
𝑛𝑖=1 = 〈y,x〉
⟹ 〈x,y〉=〈y,x〉
(4) Sea x = (x1,…,xn)≠0, 〈x,x〉 = 〈(x1,…,xn),(x1,…,xn)〉 = ∑ x𝑖xi𝑛𝑖=1 = ∑ 𝑥𝑖
2𝑛
𝑖=1>0
⟹ 〈x,x〉>0
Observaciones: En general, en un espacio vectorial V pueden definirse más de un producto interno que cumpla las 4 leyes y en particular, para V=Rn también. Del conjunto de productos internos que se pueden definir en Rn, el
producto interno canónico es uno de ellos. Un espacio vectorial dotado de un producto interno se denomina espacio prehilbert o prehilbertiano. El espacio Rn (dimensión finita), espacio vectorial sobre R, dotado del producto interno
canónico se llama espacio Euclídeo de dimensión n. Si la dimensión es finita y el cuerpo es el de los números complejos se denomina espacio unitario. Al
-
17
producto interno canónico también se lo llama producto escalar y se lo denota como x∙y.
Ejemplo: Sean x,yϵR4 x = (1,-2,0,-3), y = (2,1,1,-2), entonces:
x∙y=1∙2+(-2)∙1+0∙1+(-3)(-2)=6
Propiedades del producto escalar
1) ∀ x,yϵRn y ∀ kϵR se cumple: x∙(ky) = k(x∙y) = (kx)∙y 2) ∀ x,y,zϵRn se cumple: x∙(y+z) = x∙y + x∙z 3) x=0, yϵRn, entonces: x∙y = 0
Definición geométrica del producto escalar en un espacio Euclídeo
real
Sean A y B vectores de R2, entonces sobre el cuerpo R tenemos
A • B = AxBx+AyBy Por simplicidad supongamos que el vector B está sobre el eje x, entonces By
=0, con lo cual Ax es la proyección de A sobre B, Bx=B, es decir: A • B = AxB = A(proyectado sobre B) B
A cosθ es la proyección escalar de A en B. El producto escalar de dos vectores en un espacio Euclídeo se define como el producto de sus módulos por el
coseno del ángulo θ que forman: A • B = A B cosθ.
La expresión geométrica del producto escalar permite calcular ángulo existente entre los vectores mediante:
cosθ =𝐀•𝐁
AB donde A • B = AxBx+AyBy
La expresión anterior es válida en Rn. La importancia en Física del producto
escalar radica en lo siguiente: sea una magnitud escalar W que depende de una magnitud vectorial δr y de, por ejemplo, un campo vectorial que depende de la posición. Por ejemplo, una partícula que se mueve en un campo vectorial
F(r) y δr indica la variación del desplazamiento de la partícula en el espacio. La variación de trabajo δW que produce la fuerza F(r) cuando el
desplazamiento de la partícula varía en una magnitud δr es:
-
18
δW ≃ F(r) • δr
El producto escalar nos asegura que solo utilizamos la componente de la fuerza que es paralela al desplazamiento. De esta manera, el trabajo total
realizado por el campo F(r) en toda la trayectoria es, sumando todas las contribuciones de la fuerza (en la dirección de δr) para cada desplazamiento δr:
∑δW ≃ ∑ F(r) • δr
Si los δr se los toma infinitamente pequeños, la última ecuación se transforma en exacta (la suma se transforma en una integral y los δr se transforman en diferenciales de desplazamiento):
∫dW = W = ∫ F(r) • dr
Como ejemplo sencillo pensemos en calcular el trabajo realizado por el peso sobre un bloque que cae desde lo alto de un plano inclinado. En el caso teórico
presentado, la fuerza y el ángulo que ella forma con el desplazamiento dependen de la posición, mientras que en este ejemplo son constantes.
Además, la trayectoria es simplemente una recta.
En este caso dW = w • dr = w dr cosComo y w no varían con la posición:
W = w cos∫dr ⟹ W=w L cos
-
19
Definición de norma Euclídea
En un espacio Euclídeo ordinario los vectores son representables como segmentos orientados entre puntos de dicho espacio. Dado un vector de un espacio vectorial Euclídeo, la norma de un vector se define como la distancia
Euclídea (en línea recta) entre dos puntos A y B que delimitan dicho vector. De hecho, en un espacio Euclídeo la norma de un vector coincide precisamente con el módulo del vector AB. Si bien la norma coincide con el módulo del
vector, hay que ser cuidadoso en diferenciar ambos conceptos. Si se trata de espacios vectoriales equipados con producto interno se dice que son espacios
normados. En este apunte nos referiremos a la norma de un vector. -En dos dimensiones:
||𝐀𝐁|| = √(𝑏1 − 𝑎1)2 + (𝑏2 − 𝑎2)2
Siendo OA= (a1,a2) y OP= (b1,b2) y O el origen de coordenadas de dicho espacio. -Extendiendo lo anterior al espacio Euclídeo de tres dimensiones, es también elemental que:
||𝐀𝐁|| = √(b1 − a1)2 + (b2 − a2)2+(b3 − a3)2
siendo OA= (a1,a2,a3) y OB=(b1,b2,b3).
En el caso general de un espacio Euclídeo de n dimensiones se tiene:
||𝐀𝐁|| = √(b1 − a1)2 + ⋯ + (bn − an)2
siendo OA= (a1,…,an) y OB= (b1,…,bn) .
De lo anterior se sigue que, fijada una base ortonormal B / dim(B)=n en la que un vector v viene dado por sus componentes en esta base, vB=(v1,…,vn),
entonces la norma de dicho vector viene dada por:
||𝐀𝐁|| = √v12+. . . +v𝑛2
Definición matemática general de norma
La definición general de norma se basa en generalizar a espacios vectoriales abstractos la noción de módulo de un vector de un espacio Euclídeo.
Recuérdese que en un espacio no Euclídeo el concepto de camino más corto entre dos puntos ya no es identificable necesariamente con el de la línea recta; por ello, se utilizan las propiedades operacionales de la norma Euclídea
definida más arriba para extraer las condiciones que debe cumplir la “norma de un vector”, o norma vectorial, en un espacio vectorial cualquiera. Estas condiciones básicas son:
- Siempre es no negativa e independiente del sentido (orientación) de la medición.
-
20
- La longitud debe ser directamente proporcional al tamaño (es decir, doble -o triple- de tamaño significa doble -o triple- de longitud).
- La longitud entre dos puntos será siempre menor o igual que la suma de longitudes desde esos mismos dos puntos a un tercero diferente de ellos (desigualdad triangular: la suma de dos lados de un triángulo nunca es menor
que el tercer lado, también generalizada en la desigualdad de Cauchy-Schwarz). Esto genera la siguiente definición matemática.
Sea V un espacio vectorial sobre un cuerpo K y x un vector del espacio. Se
dice que || ||: V → R es un operador que define la norma de x, y escribimos ||𝐱||,
si cumple:
1. Para todo x de V su norma ha de ser no negativa||𝐱|| >0, y será cero si y sólo
si x es el vector nulo: x=0 entonces ||𝐱|| = 0.
2. Para todo x de V y para todo k de K se satisface que ||𝑘𝐱||= |k|||𝐱||
3. Para todos x e y de V se cumple que: ||𝐱 + 𝐲|| ≤ ||𝐱|| + ||𝐲||, (desigualdad
triangular). Cualquier operador que cumpla estas tres condiciones, y en cualquier
geometría, será un operador norma. De lo mencionado más arriba, se deduce que para un vector x de Rn:
||𝐱|| = √𝐱 • 𝐱
De la definición de producto escalar se desprende que si x e y son ortogonales entonces x • y = 0.
Definición: se dice que un conjunto de Rn es ortogonal si todo par de vectores distintos de dicho conjunto es ortogonal.
Definición: un conjunto es ortonormal si es ortogonal y todos los vectores del conjunto tienen norma uno. Base ortonormal
En el caso particular de los conjuntos ortonormales que son bases de Rn, los
llamaremos bases ortonormales de Rn y se abrevian como bon. Ejemplo: B={(1,0,0),(0,1,0),(0,0,1)} es una base ortonormal de R3.
Base canónica
En álgebra lineal, sea un espacio vectorial sobre un cuerpo de escalares R o C, la base canónica o base usual es una colección de vectores linealmente independientes cuyo número coincide con la dimensión del propio espacio vectorial. De entre las (infinitas) bases existentes, la base canónica está
normalizada, es decir, los módulos de los vectores son unitarios, o lo que es lo mismo, valen una unidad métrica, según el sistema de referencias utilizado. Además, en geometría euclidiana, los vectores de la base se fijan a un punto
de aplicación común, que es el punto de origen del sistema de referencia o
https://es.wikipedia.org/wiki/%C3%81lgebra_linealhttps://es.wikipedia.org/wiki/Espacio_vectorialhttps://es.wikipedia.org/wiki/Cuerpo_(matem%C3%A1tica)https://es.wikipedia.org/wiki/Escalar_(matem%C3%A1tica)https://es.wikipedia.org/wiki/Dimensi%C3%B3nhttps://es.wikipedia.org/wiki/%C3%81lgebra_linealhttps://es.wikipedia.org/wiki/M%C3%B3dulohttps://es.wikipedia.org/wiki/Vectorhttps://es.wikipedia.org/wiki/Unitariohttps://es.wikipedia.org/wiki/Sistema_de_referencia
-
21
punto cero. Todas estas características hacen que la base canónica sea única para cada espacio vectorial.
Sea B= {i, j, k} la base canónica del espacio Euclídeo R3 siendo i=(1,0,0), j=(0,1,0) y k=(0,0,1).
En la figura, el vector aϵR3 tiene 3 componentes ax, ay y az. Estas son las
proyecciones del vector a sobre cada uno de los ejes, es decir:
ax = Proyx(a) = (ax,0,0) = ax(1,0,0)
ay = Proyy(a) = (0,ay,0) = ay(0,1,0)
az = Proyz(a) = (0,0,az) = az(0,0,1)
Es decir que a= ax +ay +az. Notar que las componentes del vector se pueden
escribir (usando la base canónica) como: ax=axi, ay=ayj y az=azk. Los escalares ax, ay y az son las coordenadas del vector a en la base canónica.
Aplicación
Un bloque de masa m cae por un plano inclinado, que forma un ángulo plano con la horizontal, con una fuerza de roce f. Sobre el bloque se ejercen una
fuerza F horizontal y otra fuerza T que aprieta al bloque contra el plano, tal como se indica en la figura.
En el sistema de referencia a la derecha de la figura, se muestran las fuerzas que actúan sobre el bloque. Para determinar los ángulos, vemos el siguiente teorema.
Teorema: Sean dos segmentos S y T con origen común O que forman un ángulo entre sí. A continuación, se trazan otras dos segmentos S’ y T’ con
-
22
origen común O’ que forman un ángulo ’ entre sí. Si S ┴ S’ y T ┴ T’, se puede demostrar que ’.
Para ilustrar como se aplica el teorema, basta visualizar el primer par de segmentos S y T como la base del plano y el plano mismo. El segundo par de
segmentos están contenidos en las rectas de acción de las fuerzas T y W. Como son perpendiculares dos a dos tal como lo pide el teorema, resulta que el
ángulo que forman los vectores T y W es Haciendo un razonamiento análogo, se deduce que el ángulo entre la fuerza F y el eje x también vale
Aplicamos la segunda ley de Newton F = ma al bloque:
F + N + W + T + f = ma
Sea la base ortonormal B={i,j} de R2. En esta base, la ecuación anterior se escribe como:
F cosi + F senj + N j – W cosj + W seni – T j – f i = ma i
(F cos+ W sen- f - ma) i + (F sen+ N – W cos- T) j = 0
Puesto que i y j son elementos de una base ortonormal, son linealmente independientes, por lo tanto sus coeficientes tienen que ser nulos.
F cos+ W sen- f – ma = 0
F sen+ N – W cos- T = 0
Este sistema de ecuaciones lineales permite resolver el problema y muestra
como debe ser abordado el problema. El estudiante debe convencerse de establecer un sistema de referencia, y con él una base ortonormal del espacio. Notar que el sistema anterior también puede obtenerse multiplicando
miembro a miembro la ecuación vectorial escalarmente una vez por el versor i y otra por el versor j. Téngase en cuenta que i • i = j • j =1 y i • j = 0.
Observación: Notar que en la suma de fuerzas del ejemplo, no importan las
direcciones de los vectores y que no hay que separar en suma de fuerzas en el eje x y suma de fuerzas en el eje y (muchos libros de texto incurren en este
error). Además, si bien dentro del conjunto de sistemas inerciales no existe ninguno privilegiado, es conveniente adoptar como sistema de referencia aquellos en que uno de sus ejes coincida con las componentes naturales de la
aceleración. Por ejemplo, en el caso del movimiento circular, conviene tomar ejes ortogonales tales que coincidan con la aceleración radial y la tangencial.
-
23
En nuestro caso, puesto que la aceleración es lineal, basta tomar uno de los ejes cartesianos que coincida con la recta de acción de la aceleración.
Aplicación
Una canica de masa m cuelga de una soga sin masa y se halla en el punto
más bajo. Mediante una fuerza horizontal F es separada con rapidez constante de su punto de equilibrio. Si la tensión en la soga es T, determinar el valor de la fuerza F.
En este ejemplo hay que ser cuidadosos en entender que significa rapidez constante. En muchos libros de texto, el problema viene planteado de esta
manera. Sin embargo, hay que entender dos cosas:
(1) Dado que la velocidad es un vector tangente a la trayectoria, esta no tiene posibilidad de mantenerse constante (salvo su módulo o rapidez). Esto solo
podría ocurrir en una trayectoria recta.
(2) El problema planteado de esta forma solo podría estar refiriéndose a velocidad angular constante. En definitiva, lo cierto es que la masa m tiene un
vector velocidad que varía en el tiempo, es decir, está acelerada. La aceleración que posee la masa es la aceleración centrípeta.
La segunda ley de Newton nos dice que T + W + F = mac. Elijamos la base canónica B={i, j}. En esta base, la ecuación anterior se escribe como:
-T seni + T cosj – W j + F i = m(-ac seni + ac cosj)
Nótese que como la aceleración centrípeta apunta radialmente hacia el centro (como la tensión), se descompone igual que esta.
La ecuación vectorial anterior se desacopla en un sistema de dos ecuaciones escalares. Siguiendo los pasos de la aplicación anterior obtenemos:
-
24
-T sen+ F = -mac sen
T cos- W = mac cos
Multiplicando la primera ecuación por cos, la segunda por seny sumando miembro a miembro se obtiene:
F cos- W sen
De donde resulta F = W tany como F = Fi entonces: F = W tan i. Por otro lado, de la segunda ecuación en el sistema: T = mac + W/cosrecordar que ac=v2/R, si la velocidad de subida y el radio de la cuerda son datos).
Sea ahora una nueva base ortonormal B’={𝒆∧
𝒓, 𝒆∧
𝒕}, definida por un versor 𝒆∧
𝒓 en
la dirección radial y otro 𝒆∧
𝒕 en la dirección tangencial a la trayectoria de la canica en sentido antihorario.
Vamos a escribir los vectores de las fuerzas en la base ortogonal teniendo en
cuenta los ángulos.
La suma de fuerzas T + W + F = mac se puede escribir en esta base como:
-T 𝒆∧
𝒓 + W cos𝒆∧
𝒓W sen𝒆∧
𝒕F sen𝒆∧
𝒓F cos𝒆∧
𝒕mac 𝒆∧
𝒓
Multiplicando escalarmente por 𝒆∧
𝒓 y 𝒆∧
𝒕 se obtienen las ecuaciones escalares:
-T + W cos+ F sen= -mac
-W sen+ F cos= 0
-
25
De la última ecuación se obtiene F = W tan y remplazando F en la primera
queda:
T = mac + W/cos
Idéntico a lo que se obtuvo en el caso de la elección de la base canónica. La
pregunta es inevitable: ¿cuál de las dos bases conviene usar? La respuesta es
la segunda, pues si bien arroja el mismo resultado, permite expresar la
aceleración en una sola componente, lo cual simplifica el cálculo cinemático
posterior. Aclaración: Solo en el caso que se indique que el cuerpo se mueve
cuasi-estáticamente, se debe tomar ∑F = 0.
Aplicación
Un bloque de masa m se deja caer desde la parte más alta de una semiesfera
de radio R. Entre el bloque y la semiesfera existe roce con coeficiente de roce
. Hallar la ecuación diferencial que rige el movimiento del bloque.
Al deslizarse sobre la semiesfera, la masa acelera y su aceleración se puede
descomponer en aceleración radial aR (la aceleración centrípeta) y at (la
aceleración tangencial). Llamemos al ángulo entre el vector posición y la
vertical. Sean N, fR y W las fuerzas que actúan sobre el bloque.
Aplicando la segunda ley de Newton resulta:
N + fR + W = ma
Definimos una base ortonormal B={er,et} y escribimos la segunda ley de
Newton en esa base.
N er + fR et - mg coser - mg senet = -mar er - mat et
Multiplicando escalarmente por er y et respectivamente se obtiene:
N - mg cos= -mar
fR - mg sen=-mat
-
26
Como fR=se tiene:
fR = (mg cos- mar)
Reemplazando fR:
(mg cos- mar) - mg sen=-mat
ar + g(sencos) = at
Por otro lado:
𝑎𝑡 =𝑑𝑣
𝑑𝑡=
𝑑𝑣
𝑑𝜃
𝑑𝜃
𝑑𝑡=
𝑑𝑣
𝑑𝜃𝜔 =
𝑑𝑣
𝑑𝜃
𝑣
𝑅=
1
2𝑅
𝑑𝑣2
𝑑𝜃 , 𝑎𝑟 =
𝑣2
𝑅
Reemplazando el valor de las aceleraciones:
1
2𝑅
𝑑𝑣2
𝑑𝜃= 𝑔(𝑠𝑒𝑛𝜃 − 𝜇𝑐𝑜𝑠𝜃) + 𝜇
𝑣2
𝑅
Llamando v2/2R = u y remplazando se obtiene la ecuación diferencial
requerida:
𝑑𝑢2
𝑑𝜃− 2𝜇𝑢 = 𝑔(𝑠𝑒𝑛𝜃 − 𝜇𝑐𝑜𝑠𝜃)
Suma directa de espacios vectoriales
Definición: Sea V un K espacio vectorial y sean S y T subespacios de V.
Definimos la suma de S y T como el subespacio S + T = 〈S,T〉. En el caso en que S ∩ T = {0}, es decir que el único elemento en común entre los dos espacios
es el vector nulo, decimos que la suma es directa y notamos:
S + T = S ⊕ T
Para una suma común, la dimensión del subespacio suma se calcula a partir
de:
dim(S+T) = dim(S) + dim(T) – dim(S∩T)
Ejemplo: Sean los subespacios formados por los planos xy y xz, (tienen como
intersección al eje x) que los denotaremos como Vxy(R) y Vyz(R) (ambos planos, es decir de dimensión 2) respectivamente. Puesto que Vxy(R)∩Vxz(R)=Vx(R) (una recta de dimensión 1), la dimensión de la suma es:
dim(Vxy(R)+ Vxz(R)) = dimVxy(R) + dimVxz(R) - dimVxy(R)∩Vxz(R) = 2+2-1 = 3
-
27
Considerando cada uno de las tres rectas que definen los ejes x, y, z como
variedades de un mismo tipo de subespacio vectorial, los denotaremos como Vx(R), Vy(R) y Vz(R). La suma directa de estos subespacios vectoriales de dimensión unitaria es factible debido a que se cumple la condición que el
único elemento que tienen en común es el punto {0}, es decir que:
Vx(R)∩Vy(R)∩Vz(R) = {0}
En general, sean S y W subespacios. Si la intersección entre S y W es el subespacio trivial (es decir, el vector nulo), entonces a la suma se la llama “suma directa”. Es decir que si:
S ∩ W = {0} ⇒ S ⊕ W.
Entonces, puesto que dim(S∩W)=0 obtenemos la Fórmula de Grassmann:
dim(S⊕W) = dim(S) + dim(W)
Esto significa que todo vector de S+W, se escribe de manera única como la suma de un vector de S y otro de W. Esto significa que dado sϵS y wϵW,
entonces s+w es único. La suma directa de los tres subespacios vectoriales Vx, Vy y Vz da como resultado el espacio Euclídeo R3:
Vx(R) ⊕Vy(R) ⊕Vz(R)=R3
Cualquier vector vϵR3 se puede escribir como la suma de tres vectores que
pertenecen a cada uno de los subespacios Vx(R), Vy(R) y Vz(R). Tómese en cuenta que:
dim(Vx(R) ⊕Vy(R) ⊕Vz(R))=dim(Vx(R))+dim(Vy(R))+dim(Vz(R))=1+1+1 =3.
Los vectores de norma unitaria se los llama versores.
Versor asociado a un vector
Con frecuencia resulta conveniente disponer de un vector unitario que tenga
la misma dirección que un vector dado v. A tal vector se le llama versor
asociado al vector v y se puede representar por 𝐯⋀. La operación que permite
hallar 𝐯⋀ es la división del vector por su módulo:
𝐯⋀
=𝐯
||𝐯||
Al proceso de obtener un versor asociado a un vector se le conoce como normalización del vector, razón por la cual es común referirse a un vector unitario como vector normalizado.
https://es.wikipedia.org/wiki/Suma_directa
-
28
||𝑣∧
|| = ||𝑣
||𝑣|||| = √(
𝑣𝑥||𝑣||
)2 + (𝑣𝑦
||𝑣||)2 + (
𝑣𝑧||𝑣||
)2 =1
||𝑣||√𝑣𝑥2 + 𝑣𝑦2 + 𝑣𝑧2 =
||𝑣||
||𝑣||= 1
El método para transformar una base ortogonal (obtenida, por ejemplo
mediante el método de ortogonalización de Gram-Schmidt) en una base ortonormal (es decir, una base en la que todos los vectores son versores) consiste simplemente en normalizar todos los vectores de la base utilizando la
ecuación anterior. Los vectores de norma unitaria se los llama versores. Por ejemplo, i, j, k se los
llama versores canónicos. Producto vectorial
Sean dos vectores a y b en el espacio vectorial R3. El producto vectorial entre
a y b da como resultado un nuevo vector, c. El producto vectorial entre a y b se denota mediante axb, por ello se lo llama también producto cruz. En los textos manuscritos, para evitar confusiones con la letra x (equis), es frecuente
denotar el producto vectorial mediante: a ∧ b. El producto vectorial puede definirse de una manera más compacta de la siguiente manera:
axb = ||𝐚|| ||𝐛|| senθ 𝐧⋀
donde 𝐧⋀ es el vector unitario y ortogonal a los vectores a y b, y su dirección
está dada por la regla de la mano derecha, y θ es, como antes, el ángulo entre a y b. A la regla de la mano derecha se la llama a menudo también regla del tirabuzón.
El producto vectorial cumple:
- el módulo de ||𝐚 x 𝐛 || = 𝑎 𝑏senθ, en donde θ es el ángulo orientado formado
por los vectores a y b y equivale al área del paralelogramo que forman a y b. Es por eso que si a y b son paralelos o antiparalelos, la norma del producto vectorial es nula porque el área de dicho paralelogramo en ambos casos es
nula (además, θ es cero o 180° con lo que la función seno se anula). - el vector axb es perpendicular a cada uno de los vectores a y b. - la dirección del vector axb respecto a los vectores a y b es igual que la del eje coordenado Oz respecto a los ejes coordenados Ox y Oy, como si girase de Ox a Oy y avanzase en la dirección positiva de Oz.
Sean los vectores concurrentes u,v de R3, el espacio tridimensional, según la base canónica. Se define el producto:
u = uxi + uyj + uzk; v = vxi + vyj + vzk; w = wxi + wyj + wzk
-
29
Donde w es el producto vectorial de u y v, definido así:
x: R3 x R3 → R / (u ; v) → w = uxv
donde la última fórmula se interpreta como:
w = uxv = (uyvz-uzvy)i + (uzvx-uxvz)j + (uxvy-uyvx)k
Es decir:
wx = uyvz -uzvy; wy = uzvx-uxvz; wz = uxvy-uyvx
Usando una notación más compacta, mediante el desarrollo por la primera
fila de un determinante simbólico de orden 3 (simbólico ya que los términos de la primera fila no son escalares):
uxv = det[(i,j,k);(ux,uy,uz);(vx,vy,vz)] Ejemplo: El producto vectorial axb de los vectores a = (2; 0; 1) y b = (1;-1; 3) se calcula del siguiente modo:
axb = (0*3-1*(-1)) i - (2*3-1*1) j + (2*(-1)-0*1) k ⇒ axb = i-5j-2k
Propiedades del producto vectorial
Identidades
Cualesquiera que sean los vectores a, b y c : 1. axb = -(bxa), anticonmutatividad. 2. a ∙ (axb) = 0, cancelación por ortogonalidad.
3. Si axb = 0 con a≠0 y b≠0 ⇒ a ∥ b; esto es, la anulación del producto vectorial proporciona la condición de paralelismo entre dos direcciones. 4. (a + b)xc = axc + bxc.
5. ax(bxc) = b(a∙c) - c(a∙b), conocida como regla de la expulsión. 6. ax(bxc) + cx(axb) + bx(cxa) = 0,conocida como identidad de Jacobi.
7. |axb|= |a||b|sin θ, en la expresión del término de la derecha, sería el módulo de los vectores a y b, siendo θ, el ángulo menor entre los vectores a y b ;esta expresión relaciona al producto vectorial con el área del paralelogramo que definen ambos vectores.
8. El módulo o norma del producto vectorial puede calcularse fácilmente sin hacer el producto vectorial:
∥axb∥ = [∥a∥2∥b∥2-(a∙b)2)]1/2
-
30
9. El vector unitario:
𝐧⋀
=𝐚x𝐛
∥ 𝐚x𝐛 ∥
es normal al plano que contiene a los vectores a y b.
10. axa = 0. 11. ax(bxc) ≠ (axb)xc, no es asociativo. 12. (axb) = (a)xb = ax(b), asociatividad respecto del factor escalar.
Bases ortonormales y producto vectorial
Sea un sistema de referencia S = f{O; i; j; k} en el espacio vectorial R3. Se dice que S es una base ortonormal derecha si cumple con las siguientes condiciones:
1. i∙j = j∙k = k∙i = 0; es decir, los tres vectores son ortogonales entre sí.
2. ||𝐢|| = ||𝐣|| = ||𝐤|| = 1; es decir, los vectores son vectores unitarios (y por lo
tanto, dada la propiedad anterior, son ortonormales).
3. i x j = k, j x k = i, k x i = j; es decir, cumplen la regla de la mano derecha.
Aplicación
En la física del cuerpo rígido se presenta a menudo el problema de calcular el
torque efectuado por una fuerza F en un punto P del sólido. Definiendo un sistema de referencia equipado con una bon, quedan establecidas las magnitudes vectoriales F, r (la posición del punto P) y
El torque respecto al origen O, efectuado por la fuerza F aplicada en el punto
P viene dado por:
Fr x F Como ejemplo, calculemos el torque total (la suma de los torques) producidos sobre una placa cuadrada de lado a por las fuerzas F, S y T como se muestra
en la figura con las posiciones de los puntos de aplicación de las fuerzas.
-
31
Es decir:
∑F+ S+ T= 0 x F rSx SrTx T Si elegimos la base de R3 B={(1,0,0),(0,1,0),(0,0,1)}, los vectores se escriben:
F = (0,F,0), T = (Tsenθ,Tcosθ,0), S = (S,0,0), rT = (a,0,0) y rS = (a,a,0)
Remplazando en la suma de los torques respecto de O resulta:
∑aT cos- aS) k Puesto que el eje z apunta entrando al plano del papel, entonces si:
aT cos- aS > 0
∑entra al plano, mientras que si:
aT cos- aS
-
32
A diferencia de la base canónica, 𝒆∧
𝒓 y 𝒆∧
𝒕 dependen del tiempo. El versor 𝒆∧
𝒓 rota
apuntando hacia la partícula que está rotando, el versor 𝒆∧
𝒕 (que es
perpendicular a 𝒆∧
𝒓) se mantiene tangente a la trayectoria, mientras que el
versor 𝒆∧
𝒛 equivale al versor k. El vector posición de la partícula se puede
escribir en esta base como r = r 𝒆∧
𝒓 y su velocidad v = v 𝒆∧
𝒕. Dado que el módulo de la velocidad angular se define como t, multiplicando y dividiendo por r se obtiene rrt.
Pero rrepresenta el arco s = rde circunferencia recorrido por la partícula, de modo que s/rt. Como s/t=v (la rapidez de la partícula), resulta que el módulo de la velocidad angular es v/r, por lo tanto:
v =r Con esto, se puede definir el vector velocidad angular como:
v =x rReemplazando resulta:
v 𝒆∧
𝒕 =x r𝒆∧
𝒓
Multiplicando vectorialmente a izquierda por 𝒆∧
𝒓
𝒆∧
𝒓 x (v 𝒆∧
𝒕) =𝒆∧
𝒓 xx r𝒆∧
𝒓)
v (𝒆∧
𝒓 x 𝒆∧
𝒕) = r (𝒆∧
𝒓 xx 𝒆∧
𝒓))
-
33
Pero 𝒆∧
𝒓 x 𝒆∧
𝒕= 𝒆∧
𝒛, entonces:
v 𝒆∧
𝒛 = r (𝒆∧
𝒓 xx 𝒆∧
𝒓))
Usando la identidad vectorial ax(bxc) = b (a∙c) – c (a∙b) resulta:
𝒆∧
𝒓 xx𝒆∧
𝒓) =(𝒆∧
𝒓∙𝒆∧
𝒓)𝒆∧
𝒓 (𝒆∧
𝒓∙
Como 𝒆∧
𝒓∙𝒆∧
𝒓 = 1 y 𝒆∧
𝒓∙𝒆∧
𝒓y son perpendiculares) queda finalmente:
v 𝒆∧
𝒛 = rEs decir:
v/r) 𝒆∧
𝒛 Que es la expresión vectorial de la velocidad angular. El vector velocidad
angular es perpendicular a la órbita de la partícula, y su módulo es v/r. Notar que si la rapidez es constante, el módulo de la velocidad angular es constante. Si por ejemplo, la rapidez aumenta con aceleración constante en un intervalo
de tiempo Δt, también lo hace y por ello ΔΔt será la aceleración angular
Matriz de Rotación
En álgebra lineal, una matriz de rotación es la matriz que representa una
rotación en el espacio Euclídeo. Por ejemplo, la matriz:
R(θ)=(cos θ − sin θ sin θ cos θ
)
representa la rotación de ángulo θ del plano en sentido antihorario. En tres dimensiones, las matrices de rotación representan las rotaciones de manera
concisa y se usan frecuentemente en geometría, Física e informática. Aunque en la mayoría de las aplicaciones se consideran rotaciones en dos o tres dimensiones, las matrices de rotación pueden definirse en espacios de
cualquier dimensión. Algebraicamente, una matriz de rotación es una matriz ortogonal de determinante uno: RT = R−1 y detR = 1. Las matrices de rotación
son cuadradas y con valores reales. Sin embargo, se pueden definir sobre otros cuerpos. El conjunto de todas las matrices de rotación de dimensión n×n forma un grupo que se conoce como grupo de rotaciones (o grupo ortogonal
especial). El grupo ortogonal especial, abreviado usualmente SO(n), es un grupo de Lie y se puede identificar con el grupo de rotaciones en el espacio Rn.
Para rotar vectores columna, estos se multiplican por la matriz de rotación en la siguiente forma:
(𝑥′𝑦′
) = (cos θ − sen θsen θ cos θ
) (𝑥𝑦)
-
34
Así las coordenadas (x',y') del punto (x,y) después de la rotación son:
x′ = x cos θ − y sen θ y′ = x sen θ + y cos θ
La dirección del vector rotado es antihoraria si θ es positiva (por ejemplo 90°), y tiene sentido horario si θ es negativo (por ejemplo −90°). Por lo tanto la matriz
de rotación horaria es:
R(-θ) = ( cos θ sin θ −sin θ cos θ
)
La matriz anterior, se obtiene cambiando θ por – θ y teniendo en cuenta que cos(-θ) = cosθ y sen(-θ) = -senθ.
Ejemplo: Rotar al vector (1, 0, 0) 90° en sentido antihorario.
R(90°) = ( 0 − 1 1 0
) (10
) = (01
)
Rotaciones básicas
Las siguientes matrices de rotación realizan rotaciones de vectores alrededor de los ejes x, y, o z, en el espacio de tres dimensiones:
Para un eje de rotación arbitrario definido por un vector v, existe una matriz de rotación general para una rotación de un ángulo θ. Cada una de estas tres rotaciones básicas se realiza en sentido antihorario alrededor del eje y
considerando un sistema de coordenadas con la regla de la mano derecha.
-
35
Notar que las matrices de rotación preservan la norma. Sea r=(x,y)ϵR2 tal que su norma es:
||𝐫|| = √𝐫 • 𝐫 = √𝑥2 + 𝑦2
Vamos a calcular la norma del vector transformado r’, donde:
r’ = (x′, y′) = (x cos θ − y sin θ, x sin θ + y cos θ)
Notar que r’• r’ = (x cos θ –y sin θ)2 + (x sin θ + y cos θ)2 = x2+y2, entonces la norma del vector transformado es:
||𝐫′|| = √𝐫′ • 𝐫′=√𝑥2 + 𝑦2 Es decir:
||𝐫′|| = ||𝐫|| Se dice entonces que la rotación preserva la norma.
Aplicación
La matriz de rotación tiene otra interpretación en lo que a sistemas de referencia se refiere. Como ya vimos, R(θ) aplicada sobre un vector v=(x,y) rota al vector v en un ángulo θ en sentido antihorario dando el vector rotado v’=(x’,y’), visto en el sistema de referencia original. Sin embargo podemos considerar que el vector v queda fijo y el sistema de referencia ha rotado un ángulo θ en sentido horario. Esto es, si rotamos el sistema, el vector v’ visto en el nuevo sistema de referencia formará un ángulo + θ respecto al nuevo sistema. Así, un vector que formaba un ángulo con el eje x, después de la transformación formará un ángulo + θ, con el eje x.
Es decir, que si la trayectoria de un móvil viene dada por el vector de posición
r(t), bajo una rotación en el sistema de referencia de un ángulo θ en sentido horario, las coordenadas del vector posición vistas en el nuevo sistema serán:
r’(t) = R(θ) r(t)
-
36
Cálculo diferencial Newton y Leibniz
A finales del siglo XVII se sintetizaron en dos conceptos los algoritmos usados
por sus predecesores, en lo que hoy llamamos «derivada» e «integral». La historia de la matemática reconoce que Sir Isaac Newton y Gottfried Leibnitz son los creadores del cálculo diferencial e integral. Ellos desarrollaron reglas
para manipular las derivadas (reglas de derivación) e Isaac Barrow demostró que la derivación y la integración son operadores inversos. Newton desarrolló en Cambridge su propio método para el cálculo de
tangentes. En 1665 encontró un algoritmo para derivar funciones algebraicas que coincidía con el descubierto por Fermat. A finales de 1665 se dedicó a
reestructurar las bases de su cálculo, intentando desligarse de los infinitesimales, e introdujo el concepto de fluxión, que para él era la velocidad con la que una variable «fluye» (varía) con el tiempo. Gottfried Leibniz, por su
parte, formuló y desarrolló el cálculo diferencial en 1675. Fue el primero en publicar los mismos resultados que Isaac Newton descubriera 10 años antes.
En su investigación conservó un carácter geométrico y trató a la derivada como un cociente incremental y no como una velocidad, viendo el sentido de su correspondencia con la pendiente de la recta tangente a la curva en dicho
punto. Leibniz es el inventor de diversos símbolos matemáticos. A él se deben los nombres de: cálculo diferencial y cálculo integral, así como los símbolos de
derivada. Derivada
Sea f: R→R una función definida por y=f(x). Sea un punto x cualquiera y f(x)
el valor de la función en ese punto. Sea x un incremento en la variable x, el valor de la función en el punto x+x, será f(x+x). Definamos los puntos P y Q1 como P≡(x, f(x)) y Q1≡(x+x, f(x+x)) los cuales definen una recta secante a la curva definida por la función.
-
37
Imaginemos el siguiente proceso: Primero veamos que el punto Q1 depende de x y x. Si consideramos que x está fijo (como consecuencia el punto P permanece fijo), entonces Q1 depende solo de x. Supongamos que el incremento x se hace en forma continua más pequeño definiendo así al punto Q2. Luego x se hace más pequeño aun, definiendo al punto Q3. Notar que en definitiva, hacer más pequeño a x no es otra cosa que hacer tender Q hacia P. Si x tiende a cero, entonces Q tiende a P. Así como sobre el eje x, queda determinado un segmento de longitud x, en el eje y queda determinado un segmento de longitud f(x+x)-f(x). ¿Cuál es el significado geométrico del proceso anterior? Las rectas que pasan por P y cualquiera de los Qj son rectas secantes a la curva. Sin embargo, en el
límite cuando x es cero, el cambio es dramático. De todas las rectas de la familia generada para cada valor de x≠0, solo la última (x=0) pierde el status de recta secante para transformarse en una recta tangente a la curva en el punto x. Para la recta secante a la curva que pasa por P y Q1, la pendiente es:
𝑚 =𝑓(𝑥 + Δx) − 𝑓(𝑥)
Δx
En particular, cuando x tienda a cero (x→0), entonces m tenderá a un valor límite que no será otra cosa que el valor de la pendiente de la recta tangente a la curva en el punto x. Este valor límite de la pendiente se llama derivada de
la función f(x) en el punto x y se denota por f ’(x):
𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0
𝑓(𝑥 + 𝛥𝑥) − 𝑓(𝑥)
𝛥𝑥
Esto quiere decir que para cada punto de la función que tenga una recta tangente, esta recta tendrá una pendiente dada por la ecuación anterior, que da un valor genérico que depende en general de la variable x.
-
38
En particular, cuando el valor de x es un valor definido (x=x0), La notación es f ’(x0) ó f ’(x)|x=x0 (hay otras notaciones pero las veremos más adelante). Propiedades de la derivada
1) Linealidad de la derivada: Sea f(x)=ap(x)+bq(x) / a,bϵR.
f(x+x)=ap(x+x)+bq(x+x)
𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0
1
𝛥𝑥{(𝑎𝑝(𝑥 + 𝛥𝑥) + 𝑏𝑞(𝑥 + 𝛥𝑥) − [𝑎𝑝(𝑥) + 𝑏𝑞(𝑥)]}
𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0
1
𝛥𝑥{𝑎[𝑝(𝑥 + 𝛥𝑥) + 𝑝(𝑥)] + 𝑏[𝑞(𝑥 + 𝛥𝑥) − 𝑞(𝑥)]}
𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0
𝑎[𝑝(𝑥 + 𝛥𝑥) + 𝑝(𝑥)]
𝛥𝑥+ 𝑙í𝑚
𝛥𝑥→0
𝑏[𝑞(𝑥 + 𝛥𝑥) − 𝑞(𝑥)]
𝛥𝑥
𝑓′(𝑥) = 𝑎𝑝′(𝑥) + 𝑏𝑞′(𝑥)
Esto significa que el operador derivada es lineal.
2) Derivada de una constante: Sea f(x)=c con cϵR. Como la función es
constante no se ve incrementada por x, es decir f(x+x)=c.
𝑓′(𝑥) = límΔx→0
𝑐−𝑐
Δx= lím
Δx→0
0
Δx=0
3) Derivada de una función lineal: Sea f(x)=ax+b.
𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0
𝑎(𝑥 + 𝛥𝑥) + 𝑏 − (𝑎𝑥 + 𝑏)
𝛥𝑥= 𝑙í𝑚
𝛥𝑥→0
𝑎𝑥 + 𝑎𝛥𝑥 + 𝑏 − 𝑎𝑥 − 𝑏)
𝛥𝑥
𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0
𝑎𝛥𝑥
𝛥𝑥= 𝑙í𝑚
𝛥𝑥→0𝑎 = 𝑎
𝑓′(𝑥) = 𝑎
4) Derivada de una función potencial: Usando la fórmula del binomio de Newton se puede demostrar que si f(x)=xn entonces: f ’(x)=nxn-1.
-
39
¿Qué significa geométricamente obtener la derivada de una función? Para contestar esta pregunta, es necesario tener en cuenta que la derivada obtenida
también es una función, y que como tal arroja un valor después de especializar la variable x en un punto determinado. El valor obtenido de la función (la derivada) es justamente la pendiente (inclinación) de la curva dada.
Ejemplo: Sea la función f(x)=-2x2+4 entonces f’(x)=-4x. Por lo tanto, esta función da la pendiente de f(x) para cualquier punto. Deseamos saber que inclinación tiene f(x) en x=-1, x=0, x=1. Basta con remplazar los valores de x en la derivada: f ’(-1)=4, f ’(0)=0 y f ’(1)=-4. Esto significa que en x=-1, la función f’(x)=-4x vale 4, entonces la inclinación de f en -1 es 4. En x=0, como f’(0)=0 la inclinación de la curva es cero. En x=1, f’(1)=-4 la función tiene pendiente negativa. Si trazamos una recta tangente a f(x) en x=-1 su pendiente será m=4 (tan=4).
Dada una función f(x), con la función derivada especializada en x=x0, hallamos la pendiente de la recta tangente a f(x) en ese punto. La ecuación de la recta, dada su pendiente m y un punto (x0,y0) que pertenece a ella, viene dada por:
y=m(x-x0)+y0 Como m=f ’(x0) y y0=f(x0), remplazando en la ecuación de la recta se obtiene:
y= f ’(x0) (x-x0)+ f(x0)
En el caso de la función del ejemplo, son puntos son: (-1,2), (0,4) y (1,2), y las
pendientes como ya vimos son: 4, 0 y -4. Las rectas tangentes a la curva en esos puntos son: y=4x+6, y=4, y=-4x+6.
-
40
Notar que la recta tangente a la función en x=0 tiene pendiente nula; esto
será motivo de estudio en los párrafos siguientes.
Continuidad y diferenciabilidad
Una condición necesaria pero no suficiente para que una función sea derivable
en un punto es que esta sea continua. Intuitivamente, una función continua es aquella en la cual pequeños incrementos en los elementos del dominio de la variable dependiente produce pequeños incrementos en el valor de dicha
función, de manera que:
f(x + Δx) = y + Δy Haciendo estos incrementos cada vez más pequeños, las variaciones se hacen
más pequeñas. Cuando estos se aproximan a cero, en el límite:
límΔ𝑥→0
𝑓(𝑥 + Δ𝑥) − 𝑦 = 0
De lo que se obtiene f(x)=y. Para un punto particular x=a, quiere decir que:
lím𝑥→𝑎
𝑓(𝑥) = 𝑓(𝑎)
Y si este último límite existe significa, en consecuencia por un teorema de
límites (un límite existe si y sólo si los dos límites laterales existen y son iguales), que toda función f(x) que cumpla con:
lím
𝑥→𝑎+𝑓(𝑥) = lím
𝑥→𝑎−𝑓(𝑥) = lím
𝑥→𝑎𝑓(𝑥) = 𝑓(𝑎)
es continua en el punto a. Como consecuencia lógica, toda función derivable en el intervalo abierto I, es continua en I. Llamemos L+ y L- a los límites laterales:
𝐿+ = Lím𝑥→𝑎+
𝑓(𝑥) 𝑦 𝐿− = Lím𝑥→𝑎−
𝑓(𝑥)
-
41
Cuando una función es discontinua, los límites laterales son distintos y
entonces se dice que el límite en x=a no existe. La relación no funciona a la inversa: el que una función sea continua no garantiza su derivabilidad. Es posible que los límites laterales sean iguales
pero las derivadas laterales no; en este caso concreto, la función presenta un punto anguloso en dicho punto. El hecho que la función sea continua y la derivada no lo sea, indica que la función no está “cortada” pero tiene un salto
en la pendiente. Un ejemplo — recurrente en la literatura usual — puede ser la función valor absoluto (también llamada módulo) en el punto (0; 0). Dicha función se expresa:
|x| = x si x ≥ 0 y |x| = –x si x
-
42
Aunque podrían calcularse todas las derivadas empleando la definición de derivada como un límite, existen reglas bien establecidas, conocidas como
teoremas para el cálculo de derivadas, las cuales permiten calcular la derivada de muchas funciones de acuerdo a su forma sin tener que calcular forzosamente el límite. Tales reglas son consecuencia directa de la definición
de derivada y de reglas previas, como puede apreciarse en todo buen texto de cálculo infinitesimal. La notación de Newton para la diferenciación respecto al tiempo, era poner un punto arriba del nombre de la función, en la segunda
derivada dos puntos y así sucesivamente:
𝑥.
=𝑑𝑥
𝑑𝑡= 𝑥′(𝑡) 𝑥
..=
𝑑2𝑥
𝑑𝑡2= 𝑥''(𝑡)
Se lee «punto x» o «x punto». Actualmente está en desuso en Matemáticas puras, sin embargo se sigue usando en áreas de la física como la mecánica, donde otras notaciones de la derivada se pueden confundir con la notación de
velocidad relativa. Se usa para definir la derivada temporal de una variable. Esta notación de Newton se usa principalmente en mecánica, normalmente para derivadas que involucran la variable tiempo como variable independiente,
tales como velocidad y aceleración, y en teoría de ecuaciones diferenciales ordinarias. Usualmente solo se emplea para las primeras y segundas
derivadas. Otra notación común para la diferenciación es debida a Leibniz. Para la función derivada de f, se escribe: df(x)/dx. También puede encontrarse como dy/dx, df/dx. Esta notación tiene la ventaja de sugerir a la derivada de una función con
respecto a otra como un cociente de diferenciales. Con esta notación, se puede escribir la derivada de f en el punto a de dos modos diferentes:
df(x)/dx|x=a = df(a)/dx
Si y=f(x) la derivada se expresa como dy/dx y las derivadas enésimas como dny/dxn . La notación más simple para diferenciación, en uso actual, es debida a Lagrange. Para identificar las derivadas de f en el punto a, se escribe: - f′(a) para la primera derivada. - f′′(a) para la segunda derivada. - f′′′(a) para la tercera derivada.
- f(n)(a) para la enésima derivada (n>3). (También se pueden usar números romanos.)
Y por último, también se utiliza Dxf o ∂xf (notaciones de Euler y Jacobi, respectivamente), y los símbolos D y ∂ deben entenderse como operadores
diferenciales. Mini tabla de derivadas
La siguiente, es una tabla adecuada para las necesidades para el estudiante de Física que recién comienza.
f(x)=c ⇒ f ’(x)=0
-
43
f(x)=xn ⇒ f ’(x)=n xn-1
f(x)=ex ⇒ f ’(x)= ex
f(x)=ax ⇒ f ’(x)=ln(a) ax
f(x)=ln(x) ⇒ f ’(x)=1/x
f(x)=loga(x) ⇒ f ’(x)=1/x ln(a)
f(x)=sen(x) ⇒ f ’(x)=-cos(x)
f(x)=cos(x) ⇒ f ’(x)=sen(x) Aplicación
Sea un móvil que se mueve en una dirección (eje x) con ecuación de posición: x(t)=x0+vt
En el espacio unidimensional de la posición, también debemos elegir una base del espacio B={i}. En este caso no tiene sentido hablar de ortonormal, ya que
no hay perpendicularidad entre vectores de la base. En esta base, la ecuación se escribe como x(t)i=x0i+vti, y multiplicando escalarmente por i resulta:
x(t)=x0 +vt Esta ecuación es una ecuación paramétrica, pues depende del parámetro t. Cuando el conjunto de ecuaciones paramétricas es unitario, es útil obtener un espacio de dimensión mayor, formado por el producto cartesiano entre el
espacio unidimensional de la posición con el tiempo.
R2espacio-tiempo=Respacio x Rtiempo
Sea f:D→R, x0ϵD/(x0-δ,x0+ δ)⊂D. Se dice que f tiene un máximo local (relativo) en x0 si f(x)≤f(x0) ∀ xϵ(x0-δ,x0+ δ) para algún δ>0. Por otro lado, se dice que f tiene un mínimo local (relativo) en x0 si f(x)≥f(x0) ∀ xϵ(x0-δ,x0+ δ) para algún δ>0. En general, se dice que f tiene un extremo local en x0 si tiene un máximo o mínimo local en x0. Para saber si el extremo es un máximo o un mínimo se ve si f
’’(x0)0 respectivamente. Teorema de Fermat
Sea f:(a,b)→R y xoϵ(a,b). Si f es derivable en x0 y tiene un extremo en x0, entonces:
f ’(x0)=0
Teorema de Rolle
Sea f:[a,b]→R continua y derivable en (a,b). Si f(a)=f(b) entonces:
-
44
∃ c ϵ (a,b)/f ’(c)=0
Ecuaciones paramétricas
En matemáticas, un sistema de ecuaciones paramétricas permite representar una curva o superficie en el plano o en el espacio, mediante una variable
llamada parámetro, que toma valores que recorren un intervalo de números reales, considerando cada coordenada de un punto como una función dependiente del parámetro:
x=x(t) ; y=y(t) ; z=z(t);…
Un ejemplo simple de la cinemática es cuando se usa un parámetro de tiempo (t) para determinar la posición y la velocidad de un móvil.
En el uso estándar del sistema de coordenadas, una o dos variables (dependiendo de si se utilizan dos o tres dimensiones respectivamente) son consideradas como variables independientes, mientras que la restante es la
variable dependiente, con el valor de ésta siendo equivalente al de la imagen de la función cuando los restantes valores son sus parámetros. Así, por
ejemplo, la expresión de un punto cualquiera (x, y) equivale a la expresión (x,f(x)). Esta representación tiene la limitación de requerir que la curva sea una función de x en y, es decir que todos los valores x tengan un valor y sólo un valor correspondiente en y. No todas las curvas cumplen con dicha condición. Para poder trabajar con la misma como si se tratara de una función, lo que se hace es elegir un dominio y una imagen diferentes, en donde la misma sí sea función. Para hacer esto, tanto x como y son considerados variables dependientes, cuyo resultado surge de una tercera variable (sin representación gráfica) conocida como «parámetro».
La representación paramétrica de una curva en un espacio n-dimensional consiste en n funciones de una variable t, que en este caso es la variable independiente o parámetro (habitualmente se considera que t es un número real y que los puntos del espacio n-dimensional están representados por n coordenadas reales), de la forma xi = fi(t), fi : [a, b] → R , donde xi representa la i-ésima coordenada del punto generado al asignar valores del intervalo [a,b] a t. Por ejemplo, para representar una curva en el espacio se usan 3 funciones x = x(t), y = y(t), z = z(t). Es común que se exija que el intervalo [a, b] sea tal que a cada punto a ≤ t < b le corresponda un punto distinto de la curva; si las
coordenadas del punto obtenido al hacer t = a son las mismas del punto correspondiente a t = b la curva se denomina cerrada. Se dice que un punto de la curva correspondiente a un valor t del intervalo es un punto ordinario si las derivadas de las funciones paramétricas existen en y son continuas en ese punto y al menos una es distinta de 0. Si un arco de curva está compuesto
solamente de puntos ordinarios se denomina suave. Es común resumir las ecuaciones paramétricas de una curva en una sola ecuación vectorial de una
variable real (t).
r(t) = ∑ 𝑓𝑗(𝑡)𝒆∧
𝒋
𝑛
𝑗=1 = f1(t) 𝒆
∧
𝟏 + f2(t) 𝒆∧
𝟐 + ··· + fn(t) 𝒆∧
𝒏 ∈ Rn
-
45
donde 𝒆∧
𝒋 representa al vector unitario correspondiente a la coordenada j-
ésima. Por ejemplo, las funciones paramétricas de un círculo unitario con
centro en el origen son x(t)= cos(t), y(t)= sen(t). Podemos reunir estas ecuaciones como una sola ecuación de la forma:
r(t) = cos(t) i + sin(t) j
siendo B={i,j} la base usual del espacio bidimensional real. Si t recorre el intervalo [0,2π], la curva obtenida es una circunferencia de radio 1. Si t=0 se
obtiene r(0)=i, si t=45° resulta 𝐫(45°) =√2
2𝐢 +
√2
2𝐣, etcétera.
Una función vectorial de una variable real en el espacio es una función cuyo
dominio es un conjunto de números reales y cuyo rango es un conjunto de
vectores del espacio, es decir, es una función del tipo:
))(),(,)(()()()()(
: 3
thtgtfthtgtftt
I
kjir
VRr
donde hgf y, son funciones reales de variable real t , llamadas funciones
componentes de r .
Nota: Si la función vectorial r describe el movimiento de una partícula, el
vector ))(),(,)(()( thtgtft r señala su posición en el instante t . En estos casos
t representa la variable tiempo.
Ejemplos: 1) kjirVRr )1(2)32()(/: 3 tttt
2) )3,,()(/:2
3 tcostsentt rVRr
Dominio de una función vectorial
Está dado por la intersección de los dominios de sus funciones componentes,
es decir, si ))(),(,)(()( thtgtft r entonces:
)()()()( hDomgDomfDomDomI r
Ejemplo: Si tlnttt ,,1)( 2r el dominio de r será 0/ ttI R Límite y continuidad de una función vectorial
Sea la función vectorial ))(),(,)(()(/: 3 thtgtftI rVRr se define:
)(lim,)(lim,)(lim)( thtgtftlimatatatat
r
-
46
siempre que existan los límites de las funciones componentes.
Ejemplo: Si tettsentt 22,,31)( r entonces:
)1,0,1()(lim,lim,)31(lim)( 220000
t
tttt
ettsenttlim r
Si Ia , se dice que r es continua en a si )()( atlimat
rr
Teniendo en cuenta las definiciones de límite y continuidad resulta:
“La función vectorial ))(),(,)(()( thtgtft r es continua en a si y sólo si sus
funciones componentes hgf y, son continuas en a .”
Representación gráfica de una función vectorial
Sea la función vectorial ))(),(,)(()(/: 3 thtgtftI rVRr
Para cada It se obtiene un vector )(tr , que es el vector posición del punto
))(),(,)(( thtgtfP . Si la función vectorial es continua en I , es decir sus
funciones componentes f, g y h son continuas en I , define una curva C en el
espacio formada por los extremos del vector )(tr donde t varía de a a b.
Entonces la curva C es el conjunto de todos los puntos ),,( zyxP del espacio
tales que:
It
thz
tgy
tfx
con
)(
)(
)(
A estas ecuaciones se las llama ecuaciones paramétricas de la curva C y t es
el parámetro.
Cuando se grafica una curva descrita por una función vectorial )( tr , cada
punto de la misma (extremo del vector )( tr ) queda determinado por un valor
elegido para el parámetro t. Al trazar los puntos resultantes de valores
crecientes de t, la curva se va trazando en una dirección específica. En este
caso se dice que la curva está orientada positivamente.
•
P (f
r t
r(t)
C
t
z
y
x
t
-
47
Ejemplo: Sea tttt 31,22,3)( r con Rt , como r es continua en R
define una curva C en el espacio. Las ecuaciones paramétricas de C son:
It
tz
ty
tx
con
31
22
3
Estas son las ecuaciones paramétricas de una recta que contiene al punto
)1,2,3(0 P y es paralela al vector )3,2,1.(u .
Derivada de una función vectorial
Definición: Sea r una función vectorial, se define su derivada 'r como:
t
tttlimt
t
)()()('
0
rrr
Siempre que este límite exista.
Interpretación geométrica de la
derivada de una función vectorial
Supongamos que )( tr sea el vector
posición del punto P y )( tt r el vector
posición del punto Q, entonces
PQttt )()( rr se puede
considerar como un vector secante a la
curva C.
Si 0 t el vector:
PQt
tttt
1)()(
1rr
tiene la misma dirección y sentido que el vector PQ . Entonces cuando 0 t
el vector PQt
1 se aproxima a un vector que está en la recta tangente a la
curva C en el punto P. Si 0 t con un razonamiento similar se llega a la
r’(t)
t+∆t
Q
r(t)
P •
r
r(t+∆t) C
t
z
y
x
t t
-
48
misma conclusión. Por lo que al vector )(' tr se lo denomina vector tangente a
la curva C en el punto P, siempre que )(' tr exista y 0r )(' t .
La recta tangente a la curva C en el punto P es la recta que contiene a P y tiene
la dirección del vector )(' tr .
También se puede considerar el vector tangente unitario )('
)(')(
t
tt
r
rT .
Teorema: Fórmula de cálculo de )(' tr
Sea la función vectorial ))(),(,)(()()()()( thtgtfkthjtgitft r con It
tal que hgf y, son funciones derivables en I, entonces:
))('),(',)('()(')(')(')(' thtgtfkthjtgitft r
Demostración:
)(',)(',)('
)()(,
)()(,
)()(
)()(,)()(,)()(1
)(,)(,)()(,)(,)(1
)()()('
(*)000
0
0
0
thtgtf
t
thtthlim
t
tgttglim
t
tfttflim
thtthtgttgtfttft
lim
thtgtftthttgttft
lim
t
tttlimt
ttt
t
t
t
rrr
La igualdad (*) es válida pues por hipótesis hgf y, son funciones derivables.
Ejemplo: Sea ttsentcost ,,)( r con Rt , vimos que su representación
gráfica es una hélice.
1,,)(' tcostsent r
1,1,01,0,0)0(' cossenr
2
1,
2
1,0
)0('
)0(')0(
r
rT
Las ecuaciones paramétricas de la recta tangente a la hélice en
el punto )0,0,1(P son
R
t
tz
ty
x
con
1
Reglas de derivación
Sean 1r y 2r funciones vectoriales derivables, c un escalar y f una función
real derivable. Entonces
-
49
a. td
td
td
tdtt
td
d )()()()(
21
21
rrrr
b. tdtd
ctctd
d )()(
1
1
rr
c. tdtd
tfttd
tfdttf
td
d )()()(
)()()(
2
11
rrr
d. tdtd
tttd
tdtt
td
d )()()(
)()()(
2
12
1
21
rrr
rrr
e. tdtd
tttd
tdtt
td
d )()()(
)()()(
2
12
1
21
rrr
rrr
f. )('))((
))((1
1 tftd
tfdtf
td
d
rr
Observación: en c) ”.” indica el producto entre una función real y una
función vectorial, en d) “•”indica producto escalar entre funciones
vectoriales, y en e) “x” es el producto vectorial entre funciones vectoriales.
Definición de distintos tipos de curvas
Sea una curva C la representación gráfica de la función vectorial )( tr con
bat , I • C es una curva simple si batt ,, 21 tal que 21 tt resulta )()( 21 tt rr
Es decir una curva C es simple si no se cruza a sí misma al variar t en ba, . • C es una curva cerrada si )()( ba rr .
• C es una curva suave si )(' tr es continua en ba, y batt ,)(' 0r , es
decir una curva suave no posee puntos angulosos.
• C es una curva seccionalmente suave (suave a trozos o suave por partes) si
está formada por un número finito de arcos de curva suave.
•
•
•
•
•
•
Curvas simples
Curvas no simples
Curva cerrada Curva no cerrada
-
50
Longitud de un arco de curva
Sea C un arco de curva suave y simple, la representación gráfica de la función
vectorial )( tr con bat , I . Se puede probar que la longitud del arco de curva C viene dada por:
dttLb
a )('r
Ejemplo: Calcular la longitud del arco de curva C definido por la función
vectorial tsentcost ,)( r con 2,0t .
C es un arco de curva suave y simple (¡verificarlo!).
tcostsent ,)(' r
1)(' 22 tcostsentr
2
0
2tdL
Nota: Una curva puede ser descrita por más de una función vectorial. Por
ejemplo, las funciones vectoriales tsentcost ,)(1 r con 2,0t y
usenucosu 2,2)(2 r con ,0u definen la misma curva, una
circunferencia con centro en 0,0 y radio 1. Entonces para una misma curva
se tienen distintas parametrizaciones. Se puede probar que el cálculo de la
longitud de un arco de curva suave y simple es independiente de la
parametrización que se utilice.
Movimientos en el espacio: velocidad y aceleración
Supongamos una partícula que se mueve en el espacio de manera que su
posición en cada instante t de tiempo está dado por el vector )( tr .
El cociente t
ttt
)()( rr nos da la velocidad promedio en un intervalo de
tiempo t .
El vector velocidad )( tv en el tiempo t será )(')()(
)(0
tt
tttlimt
t
rrr
v
C4 C3
C2 C1
Curva seccionalmente suave
-
51
La rapidez de la partícula en el tiempo t es )(')( tt rv
El vector aceleración )(ta en el tiempo t será )('')(')( ttt rva .
Aplicación
Una partícula es arrojada verticalmente hacia arriba con una velocidad inicial
v0. Estudiar la ecuación de movimiento. Si se coloca un sistema de referencia en el punto de lanzamiento, la ecuación de movimiento es:
y(t)=v0t-½gt2
La gráfica del movimiento es una función cuadrática y viene dada por:
Las posiciones extremales de la función posición vendrán dadas por todos los tS que satisfagan: dy(t)/dt|t=ts=0. En nuestro caso se obtiene:
𝑑𝑦(𝑡)
𝑑𝑡= 𝑣0 − 𝑔𝑡 = 0
De donde t=v0/g. Esto significa que la función x(t) tiene un extremo en t=v0/g.
Además como d2y(t)/dt2=-g
-
52
Por comodidad y para comparar, se han superpuesto las gráficas de posición y de velocidad (la función y su derivada). Al comenzar el movimiento (cuando la partícula sale disparada hacia arriba) la velocidad es v0. En el tiempo que se alcanza el punto de retorno, el sentido del vector velocidad se invierte y finalmente para un tiempo t2=2v0/g vuelve al punto de partida con una velocidad –v0. Si calculamos la segunda derivada de y(t), o sea, d2y(t)/dt2 obtenemos la derivada de la derivada; dado que es una función lineal, su
pendiente es constante y por ello su derivada es una constante.
Aplicación
Un cuerpo se mueve según la siguiente ecuación de movimiento x(t)=1-e-t. Encontrar, utilizando el teorema de Fermat, los extremos, su velocidad y su aceleración.
Si planteamos dx(t)/dt se obtiene v(t)=e-t y con dv(t)/dt, a(t)= -e-t. Notar que en este caso dx(t)/dt=0 no tiene sentido pues no hay ningún t que satisfaga esa ecuación, por lo tanto, la partícula se seguirá moviendo durante un tiempo infinito y jamás llegará a la posición x=1. En la curva azul, se muestra como la velocidad es cada vez más lenta a medida que pasa el tiempo. Por otro lado,
-
53
en la curva de color negro se muestra que la aceleración es siempre negativa (aceleración de frena