introduccionalafisica.files.wordpress.com€¦ · 1 | UNIVERSIDAD NACIONAL DE MAR DEL PLATA...

1

|

UNIVERSIDAD NACIONAL DE MAR DEL PLATA FACULTAD DE CIENCIAS EXACTAS Y NATURALES

DEPARTAMENTO DE FÍSICA

Licenciatura/Profesorado en Física

_____________________________________________

Cátedra: Introducción a la Física

Lecciones populares de Matemática

básica aplicada Santiago Ramírez-Zivano y Julián Amaya

____________________________________________

Teoría de conjuntos

Introducción

La teoría de conjuntos más elemental es una de las herramientas básicas del lenguaje matemático. Dados unos elementos, unos objetos matemáticos como números o polígonos por ejemplo, puede imaginarse una colección

determinada de estos objetos, un conjunto. Cada uno de estos elementos pertenece al conjunto, y esta noción de pertenencia es la relación relativa a

conjuntos más básica. Los propios conjuntos pueden imaginarse a su vez

2

como elementos de otros conjuntos. La pertenencia de un elemento a a un conjunto A se indica como a ∈A. Una relación entre conjuntos derivada de la relación de pertenencia es la

relación de inclusión. Una subcolección de elementos B de un conjunto dado A es un subconjunto de A, y se indica como B ⊆A.

Ejemplos

-Los conjuntos numéricos usuales en matemáticas son: el conjunto de los números naturales N, el de los números enteros Z, el de los números

racionales Q, el de los números reales R y el de los números complejos C. Cada uno es subconjunto del siguiente:

N ⊂ Z ⊂ Q ⊂ R ⊂ C

-El espacio tridimensional E3 es un conjunto de objetos elementales

denominados puntos p, p ∈E3. Las rectas r y planos α son conjuntos de puntos a su vez, y en particular son subconjuntos de E3, r ⊆E3 y α⊆E3.

Algebra de conjuntos

-Unión. La unión de dos conjuntos A y B es el conjunto A∪B que contiene cada elemento que está por lo menos en uno de ellos. -Intersección. La intersección de dos conjuntos A y B es el conjunto A∩B que contiene todos los elementos comunes de A y B. -Diferencia. La diferencia entre dos conjuntos A y B es el conjunto A\B que contiene todos los elementos de A que no pertenecen a B.

-Complemento. El complemento de un conjunto A es el conjunto Ac que contiene todos los elementos (respecto de algún conjunto referencial U) que no pertenecen a A. Ac=U-A -Diferencia simétrica. La diferencia simétrica de dos conjuntos A y B es el conjunto AΔB con todos los elementos que pertenecen, o bien a A, o bien a B, pero no a ambos a la vez. -Producto cartesiano. El producto cartesiano de dos conjuntos A y B es el conjunto A×B que contiene todos los pares ordenados (a,b) cuyo primer elemento a pertenece a A y su segundo elemento b pertenece a B.

3

La relación de inclusión tiene las mismas propiedades que la relación de orden

no estricto: es reflexiva (A⊆A); transitiva (A⊆B y B⊆C implican A⊆C); y antisimétrica (A⊆B y B⊆A implican A=B).

Sistema de coordenadas

Producto Cartesiano

En matemáticas, el producto cartesiano de dos conjuntos es una

operación que tiene como resultado a otro conjunto, cuyos elementos son

todos los pares ordenados que pueden formarse de manera que el primer

elemento del par pertenezca al primer conjunto y el segundo elemento al

segundo conjunto. Sean A={a1,…,an} y B={b1,…,bm}, se define producto

cartesiano entre A y B a: AxB={(ai,bj) / aiϵA y bjϵ B}

“El producto cartesiano AxB es el conjunto formado por los pares ordenados

(ai,bj) tales que ai pertenece a A y bi pertenece a B”.

En general, dado un número finito de conjuntos A1,…,An, su producto

cartesiano se define como A1x…..xAn={(a1,….,an)/ a1ϵA1,…,anϵAn}. Los

elementos (a1,….,an) del conjunto A1x…..xAn se denominan n-tuplas. Una n-

tupla es una secuencia o lista ordenada de n elementos con nϵN. El producto

cartesiano no es conmutativo AxB ≠ BxA, ni asociativo (AxB)xC≠Ax(BxC). En

particular si los productos son entre R se obtiene Rx…..xR= Rn. Por ejemplo:

RxRxR=R3

Función coordenada

Al espacio real ∑ donde se llevan a cabo los procesos físicos es necesario

asignarle un espacio abstracto Rn en el que se pueden describir

matemáticamente los procesos en cuestión. En geometría, un punto en un

sistema de coordenadas puede estar descripto por una tupla, i.e., un conjunto

4

ordenado de números en el que cada uno de ellos está referido a la posición

sobre un eje coordenado. El proceso por el cual se asigna a cada punto del

espacio físico real un punto del espacio abstracto se realiza a través de la

función de coordenadas

Φ: ∑ → Rn / Φ(p) = (xp1,…,xpn)

donde (xp1,…,xpn) representa las coordenadas del punto en el espacio Rn obtenido

a partir de p por Φ.

Hay diferentes tipos de sistemas de coordenadas. Entre los más conocidos

están: las coordenadas cartesianas, que se utilizan en espacios como la recta,

el plano Euclídeo, el espacio tridimensional y de más dimensiones; las

coordenadas polares (utilizadas en el plano Euclídeo); las coordenadas

esféricas; las coordenadas cilíndricas; sistemas de coordenadas curvilíneas;

etc. (El término Euclídeo se definirá con precisión más adelante.)

Coordenadas cartesianas

En Física, un sistema de coordenadas que describe puntos en el espacio recibe

el nombre de sistema de referencia. En un espacio Euclídeo, un sistema de

coordenadas cartesianas se define por n ejes ortogonales igualmente

escalados. El valor de la i-ésima coordenada del punto P es igual a la

proyección ortogonal del punto sobre el i-ésimo eje coordenado.

5

En la figura, las coordenadas del punto p vienen dadas por la 3-tupla (xp1, xp2,

xp3).

Coordenadas polares

En este sistema de coordenadas bidimensionales, cada punto del plano se

determina por una distancia y un ángulo. Este consta de un punto O del plano

al que se llama polo, y una semirrecta dirigida que tiene origen en O llamada

Eje polar, equivalente al eje x del sistema cartesiano. Todo punto P del plano

corresponde a un par ordenado P≡(r,θ) donde r es la distancia de P al origen y

θ es el ángulo formado entre el eje polar y la semirrecta dirigida OP que va

de O a P. El valor de θ crece en sentido antihorario. La coordenada r (r>0) se

conoce como coordenada radial o radio vector mientras que al ángulo se lo

conoce como ángulo polar. Para O, que es un punto situado en el origen, r=0

y θ queda indefinido. Se adopta como convención representar a O como

O≡(0,0).

Definido un punto en coordenadas polares, se pueden obtener coordenadas

cartesianas a partir de x = r cosθ e y = r senθ. Si el punto del plano está dado

en coordenadas rectangulares (x,y), la coordenada polar r es: r = √𝑥2 + 𝑦2 y

θ=arc tan(x/y).

Los sistemas con simetría radial poseen características adecuadas para el

sistema de coordenadas radiales ó polares, por ejemplo, el problema de los

dos cuerpos regidos por un campo gravitatorio que obedece la ley del cuadrado

inverso. En efecto, dado que la relación entre fuerza F y distancia r entre las

masas depende solo de la coordenada r, las coordenadas polares son las más

adecuadas para describir los fenómenos relacionados con esta simetría.

Coordenadas cilíndricas

El sistema de coordenadas cilíndricas es muy conveniente en aquellos casos

en que se tratan problemas que tienen simetría de tipo cilíndrico o azimutal. Se trata de una versión en tres dimensiones de las coordenadas polares de la geometría analítica plana.

El sistema de coordenadas cilíndricas utiliza como base el sistema de coordenadas polares en 2D proyectado hacia el espacio usando la coordenada

6

z del sistema de coordenadas cartesianas. En este sistema las coordenadas x e y son reemplazadas por un vector de R3 dirigido a la

proyección del punto sobre el plano XY cuya magnitud es igual a la distancia del punto al eje z (coordenada r), la cual es la primera coordenada del sistema. El ángulo de dirección de dicho vector medido con respecto al

semieje x positivo constituye la segunda coordenada del sistema (coordenada y la tercera coordenada coincide con la coordenada z del sistema cartesiano (r,z). En la Figura pueden observarse las tres coordenadas asociadas a un punto en el sistema cilíndrico de coordenadas. Un punto en este sistema de

coordenadas se designa como P≡(r,z), y los rangos de variación de las tres coordenadas son:

0≤r

7

Coordenadas esféricas

En el sistema de coordenadas esféricas se utilizan también tres coordenadas para notar la posición de un punto P o un vector en un espacio tridimensional, dos de estas coordenadas son angulares y una de ellas es métrica.

Se utiliza la longitud de un vector que une el origen de coordenadas con punto dado. Al ángulo que este vector forma con el semieje z positivo se lo

rotula en la literatura como y al ángulo que forma la proyección de sobre el plano XY con el semieje X positivo, tal como se muestra en la Figura. Los ángulos y toman los nombres de ángulo azimutal y ángulo cenital respectivamente y un punto en este sistema de coordenadas se designa como P≡(,). En el sistema internacional, los rangos de variación de las tres coordenadas son:

02π ; 0π

Las líneas coordenadas son aquellas que se obtienen variando una de las coordenadas y manteniendo fijas las otras dos. Para las coordenadas esféricas,

estas son: -Líneas coordenadas ρ: Semirrectas radiales partiendo del origen de coordenadas. -Líneas coordenadas ϕ: Semicírculos verticales (meridianos).

-Líneas coordenadas θ: Circunferencias horizontales (paralelos).

Las superficies coordenadas son aquellas que se obtienen fijando sucesivamente cada una de las coordenadas de un punto. Para este sistema

son:

8

-Superficies ρ=cte.: Esferas con centro en el origen de coordenadas. -Superficies θ=cte.: Conos rectos con vértice en el origen. -Superficies ϕ=cte.: Semiplanos verticales.

Las líneas y superficies coordenadas de este sistema son perpendiculares dos a dos en cada punto. Por ello, éste es un sistema ortogonal.

Relación con las coordenadas cartesianas

Sobre los conjuntos abiertos:

U = {(;;) / >0; 0

9

V ó 𝑉→

Por ejemplo, E, v, ω representan respectivamente las magnitudes vectoriales

de módulos E, v y ω. El módulo de una magnitud vectorial también se

representa encerrando entre barras al correspondiente vector:

│𝐸→

│, │𝑣→│y │𝜔

→│.

En la literatura usual, es costumbre hallar los términos “origen ó punto de

aplicación’’ y “extremo libre’’ que están referidos al origen del segmento

orientado y a la punta de flecha del mismo respectivamente.

Un vector en Rn también queda descripto por una n-tupla X=(x1,x2,......,xn)

donde los números xj ϵ R representan las coordenadas del vector. Un concepto

importante que el alumno debe internalizar, es justamente la notación de la

n-tupla. Para dar un ejemplo concreto, supongamos un espacio Euclídeo

tridimensional R3. La terna (1,3,2) sirve para representar dos cosas: el punto

P del espacio que tiene coordenadas (1,3,2) y también al vector P que tiene

origen en el origen de coordenadas y su extremo libre en el punto (1,3,2), es

decir P≡(1,3,2) y P=(1,3,2).

En geometría analítica es común trabajar con superficies, planos, curvas y

rectas en el espacio. Vamos a introducir el concepto de transporte paralelo de

un vector. Sea un espacio Euclídeo R3, un plano π, un punto P≡(Px,Py,Pz) / Pϵ π y

sea n=(nx,ny,nz) un vector normal al plano cuyo origen está en P. Dijimos más

arriba que los vectores son representados con su origen en el origen de

10

coordenadas, sin embargo en este caso concreto, el origen de n está en el

punto P que pertenece al plano. Entonces, ¿cómo interpretamos las

coordenadas del vector n?

Definición: Si un vector es trasladado en forma paralela, es decir que la

posición final del vector es paralela al vector original, se dice que sus

coordenadas permanecen invariantes.

Las coordenadas del vector n están dadas en el origen de coordenadas, sin

embargo podemos trasladarlo paralelamente hasta el punto P conservando

sus propiedades. El “nuevo’’ vector n ahora está en el punto P pero sus

coordenadas siguen siendo las mismas.

Se puede establecer un vector orientando un segmento en el espacio. Sean dos

puntos P≡(p1,…,pn) y Q≡(q1,…,qn)/ P y Q ϵ Rn. Entonces:

PQ=(q1-p1,…,qn-pn) y QP=(p1-q1,…,pn-qn).

Ejemplo: Sean P≡(2,1) y Q≡(4,5) entonces PQ=(4-2,5-1)=(2,4) y QP=(2-4,1-5)

=(-2,-4)

La distancia entre dos puntos P≡(p1,…,pn) y Q≡(q1,…,qn) en un espacio

Euclídeo se puede calcular por la función distancia:

δ: Rn → R / δ(P,Q)=√(𝑞1 − 𝑝1)2+. . . +(𝑞𝑛 − 𝑝𝑛)2 = √∑ (𝑞𝑗 − 𝑝𝑗)2𝑛

𝑗=1

Notar que δ es conmutativa δ(P,Q)=δ(Q,P)>0.

11

Operaciones entre vectores (modo gráfico)

La suma gráfica de vectores se puede realizar por varios métodos, pero el más

usado es el método de la poligonal. Este consiste en dejar un vector fijo y a

continuación se toma otro vector cualquiera, se lo traslada paralelamente

hasta que su origen coincida con el extremo libre del vector que se dejó fijo. El

proceso se repite hasta que todos los vectores queden conectados formando

una poligonal. El vector que se forma uniendo el origen del primer vector con

el extremo libre del último se llama vector resultante, y su acción es

equivalente a la acción que realiza el conjunto de vectores anteriores actuando

todos simultáneamente.

Usando este método se puede calcular la resultante de por ejemplo:

a+½b-c+2d

Cuando un vector se halla multiplicado por un coeficiente k≠1, el módulo del

vector se dilata si │k│>1 y se contrae si │k│0. El cálculo se resume a una suma a+½b+(-c)+2d.

Espacios vectoriales

En principio, un espacio vectorial es una estructura algebraica creada a partir

de un conjunto no vacío, una operación interna (llamada suma, definida para

los elementos del conjunto) y una operación externa (llamada producto por un

12

escalar, definida entre dicho conjunto y otro conjunto llamado cuerpo). A los

elementos del conjunto se los llama vectores y a los elementos del cuerpo,

escalares. Al espacio vectorial lo denotaremos V y al cuerpo K.

Un espacio vectorial sobre un cuerpo K (Reales ó Complejos) es un conjunto V

no vacío, dotado de dos operaciones para las cuales es cerrado, es decir, el

resultado está en V.

Operación interna: Suma

+: V x V → V / (u,v)→ w = u+v

Posee las siguientes propiedades:

(S1) Propiedad conmutativa: u+v = v+u, ∀u,vϵV

(S2) Propiedad asociativa: (u+v)+w = u+(v+w), ∀u,v,wϵV

(S3) Elemento neutro (de la suma): ∃ eϵV / u+e = u, ∀ uϵV

(S4) Elemento opuesto (de la suma): ∃ -uϵ V/ u+(-u) = e, ∀uϵV

Operación externa: Producto por un escalar

(P1) Propiedad asociativa: a(bu) = (ab)u, ∀uϵV y ∀a,bϵK

(P2) Existencia de elemento neutro e del cuerpo K (1 en los reales): ∃ eϵV/

eu = u, ∀ uϵV.

(P3) Propiedad distributiva del producto respecto de la suma de vectores:

a(u+v) = au+av, ∀ aϵK y ∀ u,vϵV.

(P4) Propiedad distributiva del producto respecto de la suma de escalares:

(a+b)u = au+bu, ∀ a,bϵK y ∀ uϵV.

Ejemplo: Se quiere probar que R2 es un espacio vectorial sobre R.

Si R2 juega el papel de V y R el de K, los elementos uϵV=R2=RxR son, de forma

genérica, u = (ux; uy), es decir, pares de números reales. Por claridad se

conserva la denominación del vector, en este caso u, en sus coordenadas,

añadiendo el subíndice x o y para denominar su componente en el eje x o y

respectivamente. En V se define la operación suma:

+ : V x V → V / (u ; v) → w = u + v

donde u=(ux; uy), v=(vx; vy), w=(wx;wy) y la suma de u y v es:

u+v = (ux;uy) + (vx;vy) = (ux+vx;uy+vy) = (wx;wy) = w

13

donde wx= ux+ vx, wy= uy+ vy. Esto implica que la suma de vectores es interna

y bien definida.

La operación interna suma tiene las propiedades:

1) Propiedad conmutativa: u + v = v + u; ∀ u,vϵV u + v = (ux;uy) + (vx;vy) = (ux+vx;uy+vy) = (vx+ux;vy+uy) = (vx;vy) + (ux;uy) = v + u

2) Propiedad asociativa: (u + v) + w = u + (v + w)

(u + v) + w = (ux+vx;uy+vy) + (wx;wy) = (ux+vx+wx;uy+vy+wy) =

= (ux+(vx+wx);uy+(vy+wy))= (ux;uy)+(vx+wx;vy+wy)=(ux;uy)+((vx;vy)+(wx;wy))= = u + (v + w)

3) Elemento neutro 0: u + 0 = u u = (ux; uy) + (0; 0) = (ux+ 0; uy+ 0) = (ux; uy) = u

4) Elemento opuesto:

u = (ux; uy), -u = (-ux;-uy)

u+(-u) = (ux;uy) + (-ux;-uy) = (ux-ux;uy-uy) = (0;0) = 0 La operación producto por un escalar:

K x V → V /(a; u) → v = au El producto de a y u será:

au = a(ux; uy) = (aux; auy) = (vx; vy) = v Donde vx=aux y vy=auy.

Esto implica que la multiplicación de vector por escalares externa está bien definida.

5) Tiene la propiedad asociativa: a(bu) = (ab)u; ∀ a,bϵK y ∀ uϵV

a(bu) = a(b(ux;uy)) = a(bux;buy) = (abux;abuy) = (ab)(ux;uy) = (ab)u

6) Sea 1ϵR elemento neutro en el producto: 1u = u; ∀ uϵV

1u = 1(ux;uy) = (1ux;1uy) = (ux;uy) = u

7) Propiedad distributiva por la izquierda: a(u + v) = au + av; ∀ aϵK y ∀ u,vϵV a(u + v) = a((ux;uy) + (vx;vy)) = a(ux+vx;uy+vy) =(aux+avx;auy+avy)=

= (aux;auy) + (avx;avy) = a(ux;uy) + a(vx;vy)= au + av

8) Propiedad distributiva por la derecha: (a + b)u= au + bu; ∀ a,bϵK y ∀ uϵV

(a + b)u = (a + b)(ux;uy) = ((a + b)ux; (a + b)uy) = (aux+bux;auy+buy)=

= (aux;auy) + (bux;buy) = a(ux;uy) + b(ux;uy) = au + bu

Queda demostrado entonces que V=R2es espacio vectorial en R.

Se puede demostrar que Rn es también es un espacio vectorial.

Dependencia e independencia lineal

14

Definición: sea un conjunto de vectores {vj} y un conjunto de escalares {kj}

con j=1,…,n. Se define combinación lineal de los elementos de {vj} a

k1v1+…+knvn

Sea Rn espacio vectorial con sus infinitos vectores (cada punto representa un

vector) y W={v1,…,vs} un subconjunto formado por s vectores de Rn. Se dice

que W es linealmente dependiente si existen escalares k1,…,ks no todos nulos

tal que:

k1v1+…+k2v2=0 o en forma abreviada ∑ 𝑘𝑗𝐯𝑗𝑠

𝑗=1=0

Esto significa que cualquiera de los vectores de W se puede escribir como una

combinación lineal de los otros vectores de W. Si por el contrario, la única

forma de escribir la igualdad anterior fuera que todos los kj sean cero,

entonces se dice que el subconjunto de vectores de W es linealmente

independiente. La independencia lineal en un conjunto W nos dice que el

vector nulo solo puede ser escrito como una combinación lineal de sus

elementos, solo si los coeficientes son 0. En la última ecuación, 0 representa

al vector nulo (0,…,0).

Ejemplos: 1) Sea R3 y W={(1,0,0),(0,1,0),(0,0,1)}⊂R3. ¿Es W linealmente

independiente? Llamemos v1=(1,0,0), v2=(0,1,0) y v3=(0,0,1). Entonces:

∃ k1, k2 y k3 / k1(1,0,0)+k2(0,1,0)+k3(0,0,1)=0

k1(1,0,0)+k2(0,1,0)+k3(0,0,1)=(k1,0,0)+(0,k2,0)+(0,0,k3)=(k1,k2,k3)=(0,0,0)

Como una igualdad entre vectores indica igualar componente a componente,

resulta k1=0, k2=0 y k3=0, i.e., W es linealmente independiente.

2) Sea R2 y W={(2,1),(-14,-7)}⊂R2. ¿Es W linealmente independiente?

k1(2,1)+k2(-14,-7)=(2k1,k1)+(-14k2,-7k2)=(2k1-14k2,k1-7k2)=(0,0)

Entonces debe cumplirse simultáneamente que 2k1-14k2=0 y k1-7k2=0. La

solución de este sistema de ecuaciones homogéneas (igualadas a cero) no es

única, es decir el sistema es compatible indeterminado, por lo tanto existen

infinitas soluciones que cumplen k1=7k2 (esto se desprende de ambas

ecuaciones). Si los kj cumplen esta relación (por ejemplo k1=5 y k2=5/7) se

podrá escribir k1(2,1)+k2(-14,-7)=0 sin ser todos los kj iguales a 0. Luego W es

linealmente dependiente.

Subespacio generado

15

Consideremos el espacio vectorial Rn. El subespacio W⊂Rn generado por un

conjunto no vacío de vectores de Rn, es el conjunto de todas las combinaciones

lineales de todos los vectores de dicho conjunto.

Ejemplo: El conjunto W={(1,0,0),(0,1,0),(0,0,1)} genera R3. R3 puede escribirse

como una combinación lineal de los vectores de W. En efecto, el vector (c1,c2,c3)

puede escribirse como c1(1,0,0)+c2(0,1,0)+c3(0,0,1). Nótese que todo vector de

Rn puede escribirse como una combinación lineal de los vectores de W.

Base de un espacio vectorial

Consideremos el espacio vectorial Rn. Una base B de Rn es un conjunto

linealmente independiente de Rn que genera Rn. Es decir, el subespacio

vectorial generado por B es Rn. Ya vimos que {(1,0,0),(0,1,0),(0,0,1)} es

linealmente independiente y además genera a R3, por lo tanto es una base de

R3. Esta base se la conoce como la base canónica de R3.

Dimensión de un espacio vectorial

Puede demostrarse que dos bases distintas de un mismo espacio vectorial

necesariamente tendrán la misma cantidad de vectores. Este hecho habilita

la definición de dimensión.

Sea V un espacio vectorial, llamaremos dimensión de V (dim(V)) al número de vectores que tiene una base cualquiera de V. Notar que: dim(Rn)=n.

Enunciaremos una proposición que puede demostrarse en forma general para cualquier espacio vectorial, y luego analizaremos su significado para Rn.

Sea V un espacio vectorial sobre el cuerpo K, B={v1,…,vn} una base ordenada (es decir, una base donde nos importa el orden de los vectores). Entonces existen y son únicos los escalares {kj}ϵK (j=1,…,n)para cada vector vϵV tales

que:

𝐯 = ∑ kj𝐯j

𝑛

𝑗=1

Consideremos a R3 y la base canónica {(1,0,0),(0,1,0),(0,0,1)}. Sean

v=k1(1,0,0)+k2(0,1,0)+k3(0,0,1) y v’=k’1(1,0,0)+k’2(0,1,0)+k’3(0,0,1). El resultado anterior establece que para dos vectores distintos de R3, los ki no

pueden ser idénticos a los k’i. Estos escalares ki forman una n-tupla que denominaremos coordenadas del vector v (ídem para ki’ y v’). Para definir el concepto de base ortonormal (bon), es necesario antes introducir los conceptos

de producto interno y, para nuestro estudio en Rn, el producto interno canónico (también conocido como producto escalar).

Producto interno en un espacio vectorial

16

Sea V un espacio vectorial sobre K (R ó C). Un producto interno en V es una

función 〈 , 〉 : V x V → R que cumple con las siguientes condiciones: (1) ∀ x,y,zϵV: 〈x+y,z〉 = 〈x,z〉 + 〈y,z〉. (2) ∀ x,yϵV, ∀ kϵR: 〈kx,y〉 = k〈x,y〉. (3) ∀ x,yϵV:〈x,y〉* = 〈y,x〉 donde (*) indica conjugación en C. (4) ∀ xϵV si x≠0, entonces 〈x,x〉>0.

Producto interno canónico

Consideremos el espacio vectorial Kn sobre el cuerpo K. Definimos el producto interno canónico:

〈 , 〉 ∶ Kn x Kn → K / < (𝑥1,...,𝑥𝑛), (𝑦1,...,𝑦𝑛) > = ∑ xj𝑦𝑗∗

𝑛

𝑗=1

Nos interesa el caso K=R. Probemos que el producto interno canónico cumple las 4 condiciones mencionadas anteriormente.

(1) Sean los siguientes vectores en Rn: x=(x1,…,xn), y=(y1,…,yn) y z=(z1,…,zn).

Entonces:

〈x+y,z〉 = 〈(x1,…,xn)+(y1,…,yn),(z1,…,zn)〉 = ∑ (xi + yi)zi𝑛

𝑖=1 =

= ∑(xizi + yizi)

𝑛

𝑖=1

= ∑ xizi

𝑛

𝑖=1

+ ∑ yizi

𝑛

𝑖=1

=

= 〈(x1,…,xn),(z1,…,zn)〉+〈(y1,…,yn),(z1,…,zn)〉 = 〈x,z〉+〈y,z〉 ⟹ 〈x+y,z〉=〈x,z〉+〈y,z〉 (2) Sean kϵR y x=(x1,…,xn), y=(y1,…,yn)ϵRn, entonces:

〈kx,y〉 = 〈k(x1,…,xn),(y1,…,yn)〉 = 〈(kx1,…,kxn),(y1,…,yn) = ∑ kx𝑖yi𝑛𝑖=1 =

= 𝑘 ∑𝑖=1

𝑛

xiyi = k〈(x1,…,xn),(y1,…,yn)〉 = k〈x,y〉

⟹ 〈kx,y〉= k〈x,y〉

(3) 〈x,y〉 = 〈(x1,…,xn), (y1,…,yn)〉 = ∑ x𝑖yi𝑛𝑖=1 = ∑ y𝑖xi

𝑛𝑖=1 = 〈y,x〉

⟹ 〈x,y〉=〈y,x〉

(4) Sea x = (x1,…,xn)≠0, 〈x,x〉 = 〈(x1,…,xn),(x1,…,xn)〉 = ∑ x𝑖xi𝑛𝑖=1 = ∑ 𝑥𝑖

2𝑛

𝑖=1>0

⟹ 〈x,x〉>0

Observaciones: En general, en un espacio vectorial V pueden definirse más de un producto interno que cumpla las 4 leyes y en particular, para V=Rn también. Del conjunto de productos internos que se pueden definir en Rn, el

producto interno canónico es uno de ellos. Un espacio vectorial dotado de un producto interno se denomina espacio prehilbert o prehilbertiano. El espacio Rn (dimensión finita), espacio vectorial sobre R, dotado del producto interno

canónico se llama espacio Euclídeo de dimensión n. Si la dimensión es finita y el cuerpo es el de los números complejos se denomina espacio unitario. Al

17

producto interno canónico también se lo llama producto escalar y se lo denota como x∙y.

Ejemplo: Sean x,yϵR4 x = (1,-2,0,-3), y = (2,1,1,-2), entonces:

x∙y=1∙2+(-2)∙1+0∙1+(-3)(-2)=6

Propiedades del producto escalar

1) ∀ x,yϵRn y ∀ kϵR se cumple: x∙(ky) = k(x∙y) = (kx)∙y 2) ∀ x,y,zϵRn se cumple: x∙(y+z) = x∙y + x∙z 3) x=0, yϵRn, entonces: x∙y = 0

Definición geométrica del producto escalar en un espacio Euclídeo

real

Sean A y B vectores de R2, entonces sobre el cuerpo R tenemos

A • B = AxBx+AyBy Por simplicidad supongamos que el vector B está sobre el eje x, entonces By

=0, con lo cual Ax es la proyección de A sobre B, Bx=B, es decir: A • B = AxB = A(proyectado sobre B) B

A cosθ es la proyección escalar de A en B. El producto escalar de dos vectores en un espacio Euclídeo se define como el producto de sus módulos por el

coseno del ángulo θ que forman: A • B = A B cosθ.

La expresión geométrica del producto escalar permite calcular ángulo existente entre los vectores mediante:

cosθ =𝐀•𝐁

AB donde A • B = AxBx+AyBy

La expresión anterior es válida en Rn. La importancia en Física del producto

escalar radica en lo siguiente: sea una magnitud escalar W que depende de una magnitud vectorial δr y de, por ejemplo, un campo vectorial que depende de la posición. Por ejemplo, una partícula que se mueve en un campo vectorial

F(r) y δr indica la variación del desplazamiento de la partícula en el espacio. La variación de trabajo δW que produce la fuerza F(r) cuando el

desplazamiento de la partícula varía en una magnitud δr es:

18

δW ≃ F(r) • δr

El producto escalar nos asegura que solo utilizamos la componente de la fuerza que es paralela al desplazamiento. De esta manera, el trabajo total

realizado por el campo F(r) en toda la trayectoria es, sumando todas las contribuciones de la fuerza (en la dirección de δr) para cada desplazamiento δr:

∑δW ≃ ∑ F(r) • δr

Si los δr se los toma infinitamente pequeños, la última ecuación se transforma en exacta (la suma se transforma en una integral y los δr se transforman en diferenciales de desplazamiento):

∫dW = W = ∫ F(r) • dr

Como ejemplo sencillo pensemos en calcular el trabajo realizado por el peso sobre un bloque que cae desde lo alto de un plano inclinado. En el caso teórico

presentado, la fuerza y el ángulo que ella forma con el desplazamiento dependen de la posición, mientras que en este ejemplo son constantes.

Además, la trayectoria es simplemente una recta.

En este caso dW = w • dr = w dr cosComo y w no varían con la posición:

W = w cos∫dr ⟹ W=w L cos

19

Definición de norma Euclídea

En un espacio Euclídeo ordinario los vectores son representables como segmentos orientados entre puntos de dicho espacio. Dado un vector de un espacio vectorial Euclídeo, la norma de un vector se define como la distancia

Euclídea (en línea recta) entre dos puntos A y B que delimitan dicho vector. De hecho, en un espacio Euclídeo la norma de un vector coincide precisamente con el módulo del vector AB. Si bien la norma coincide con el módulo del

vector, hay que ser cuidadoso en diferenciar ambos conceptos. Si se trata de espacios vectoriales equipados con producto interno se dice que son espacios

normados. En este apunte nos referiremos a la norma de un vector. -En dos dimensiones:

||𝐀𝐁|| = √(𝑏1 − 𝑎1)2 + (𝑏2 − 𝑎2)2

Siendo OA= (a1,a2) y OP= (b1,b2) y O el origen de coordenadas de dicho espacio. -Extendiendo lo anterior al espacio Euclídeo de tres dimensiones, es también elemental que:

||𝐀𝐁|| = √(b1 − a1)2 + (b2 − a2)2+(b3 − a3)2

siendo OA= (a1,a2,a3) y OB=(b1,b2,b3).

En el caso general de un espacio Euclídeo de n dimensiones se tiene:

||𝐀𝐁|| = √(b1 − a1)2 + ⋯ + (bn − an)2

siendo OA= (a1,…,an) y OB= (b1,…,bn) .

De lo anterior se sigue que, fijada una base ortonormal B / dim(B)=n en la que un vector v viene dado por sus componentes en esta base, vB=(v1,…,vn),

entonces la norma de dicho vector viene dada por:

||𝐀𝐁|| = √v12+. . . +v𝑛2

Definición matemática general de norma

La definición general de norma se basa en generalizar a espacios vectoriales abstractos la noción de módulo de un vector de un espacio Euclídeo.

Recuérdese que en un espacio no Euclídeo el concepto de camino más corto entre dos puntos ya no es identificable necesariamente con el de la línea recta; por ello, se utilizan las propiedades operacionales de la norma Euclídea

definida más arriba para extraer las condiciones que debe cumplir la “norma de un vector”, o norma vectorial, en un espacio vectorial cualquiera. Estas condiciones básicas son:

- Siempre es no negativa e independiente del sentido (orientación) de la medición.

20

- La longitud debe ser directamente proporcional al tamaño (es decir, doble -o triple- de tamaño significa doble -o triple- de longitud).

- La longitud entre dos puntos será siempre menor o igual que la suma de longitudes desde esos mismos dos puntos a un tercero diferente de ellos (desigualdad triangular: la suma de dos lados de un triángulo nunca es menor

que el tercer lado, también generalizada en la desigualdad de Cauchy-Schwarz). Esto genera la siguiente definición matemática.

Sea V un espacio vectorial sobre un cuerpo K y x un vector del espacio. Se

dice que || ||: V → R es un operador que define la norma de x, y escribimos ||𝐱||,

si cumple:

1. Para todo x de V su norma ha de ser no negativa||𝐱|| >0, y será cero si y sólo

si x es el vector nulo: x=0 entonces ||𝐱|| = 0.

2. Para todo x de V y para todo k de K se satisface que ||𝑘𝐱||= |k|||𝐱||

3. Para todos x e y de V se cumple que: ||𝐱 + 𝐲|| ≤ ||𝐱|| + ||𝐲||, (desigualdad

triangular). Cualquier operador que cumpla estas tres condiciones, y en cualquier

geometría, será un operador norma. De lo mencionado más arriba, se deduce que para un vector x de Rn:

||𝐱|| = √𝐱 • 𝐱

De la definición de producto escalar se desprende que si x e y son ortogonales entonces x • y = 0.

Definición: se dice que un conjunto de Rn es ortogonal si todo par de vectores distintos de dicho conjunto es ortogonal.

Definición: un conjunto es ortonormal si es ortogonal y todos los vectores del conjunto tienen norma uno. Base ortonormal

En el caso particular de los conjuntos ortonormales que son bases de Rn, los

llamaremos bases ortonormales de Rn y se abrevian como bon. Ejemplo: B={(1,0,0),(0,1,0),(0,0,1)} es una base ortonormal de R3.

Base canónica

En álgebra lineal, sea un espacio vectorial sobre un cuerpo de escalares R o C, la base canónica o base usual es una colección de vectores linealmente independientes cuyo número coincide con la dimensión del propio espacio vectorial. De entre las (infinitas) bases existentes, la base canónica está

normalizada, es decir, los módulos de los vectores son unitarios, o lo que es lo mismo, valen una unidad métrica, según el sistema de referencias utilizado. Además, en geometría euclidiana, los vectores de la base se fijan a un punto

de aplicación común, que es el punto de origen del sistema de referencia o

https://es.wikipedia.org/wiki/%C3%81lgebra_linealhttps://es.wikipedia.org/wiki/Espacio_vectorialhttps://es.wikipedia.org/wiki/Cuerpo_(matem%C3%A1tica)https://es.wikipedia.org/wiki/Escalar_(matem%C3%A1tica)https://es.wikipedia.org/wiki/Dimensi%C3%B3nhttps://es.wikipedia.org/wiki/%C3%81lgebra_linealhttps://es.wikipedia.org/wiki/M%C3%B3dulohttps://es.wikipedia.org/wiki/Vectorhttps://es.wikipedia.org/wiki/Unitariohttps://es.wikipedia.org/wiki/Sistema_de_referencia

21

punto cero. Todas estas características hacen que la base canónica sea única para cada espacio vectorial.

Sea B= {i, j, k} la base canónica del espacio Euclídeo R3 siendo i=(1,0,0), j=(0,1,0) y k=(0,0,1).

En la figura, el vector aϵR3 tiene 3 componentes ax, ay y az. Estas son las

proyecciones del vector a sobre cada uno de los ejes, es decir:

ax = Proyx(a) = (ax,0,0) = ax(1,0,0)

ay = Proyy(a) = (0,ay,0) = ay(0,1,0)

az = Proyz(a) = (0,0,az) = az(0,0,1)

Es decir que a= ax +ay +az. Notar que las componentes del vector se pueden

escribir (usando la base canónica) como: ax=axi, ay=ayj y az=azk. Los escalares ax, ay y az son las coordenadas del vector a en la base canónica.

Aplicación

Un bloque de masa m cae por un plano inclinado, que forma un ángulo plano con la horizontal, con una fuerza de roce f. Sobre el bloque se ejercen una

fuerza F horizontal y otra fuerza T que aprieta al bloque contra el plano, tal como se indica en la figura.

En el sistema de referencia a la derecha de la figura, se muestran las fuerzas que actúan sobre el bloque. Para determinar los ángulos, vemos el siguiente teorema.

Teorema: Sean dos segmentos S y T con origen común O que forman un ángulo entre sí. A continuación, se trazan otras dos segmentos S’ y T’ con

22

origen común O’ que forman un ángulo ’ entre sí. Si S ┴ S’ y T ┴ T’, se puede demostrar que ’.

Para ilustrar como se aplica el teorema, basta visualizar el primer par de segmentos S y T como la base del plano y el plano mismo. El segundo par de

segmentos están contenidos en las rectas de acción de las fuerzas T y W. Como son perpendiculares dos a dos tal como lo pide el teorema, resulta que el

ángulo que forman los vectores T y W es Haciendo un razonamiento análogo, se deduce que el ángulo entre la fuerza F y el eje x también vale

Aplicamos la segunda ley de Newton F = ma al bloque:

F + N + W + T + f = ma

Sea la base ortonormal B={i,j} de R2. En esta base, la ecuación anterior se escribe como:

F cosi + F senj + N j – W cosj + W seni – T j – f i = ma i

(F cos+ W sen- f - ma) i + (F sen+ N – W cos- T) j = 0

Puesto que i y j son elementos de una base ortonormal, son linealmente independientes, por lo tanto sus coeficientes tienen que ser nulos.

F cos+ W sen- f – ma = 0

F sen+ N – W cos- T = 0

Este sistema de ecuaciones lineales permite resolver el problema y muestra

como debe ser abordado el problema. El estudiante debe convencerse de establecer un sistema de referencia, y con él una base ortonormal del espacio. Notar que el sistema anterior también puede obtenerse multiplicando

miembro a miembro la ecuación vectorial escalarmente una vez por el versor i y otra por el versor j. Téngase en cuenta que i • i = j • j =1 y i • j = 0.

Observación: Notar que en la suma de fuerzas del ejemplo, no importan las

direcciones de los vectores y que no hay que separar en suma de fuerzas en el eje x y suma de fuerzas en el eje y (muchos libros de texto incurren en este

error). Además, si bien dentro del conjunto de sistemas inerciales no existe ninguno privilegiado, es conveniente adoptar como sistema de referencia aquellos en que uno de sus ejes coincida con las componentes naturales de la

aceleración. Por ejemplo, en el caso del movimiento circular, conviene tomar ejes ortogonales tales que coincidan con la aceleración radial y la tangencial.

23

En nuestro caso, puesto que la aceleración es lineal, basta tomar uno de los ejes cartesianos que coincida con la recta de acción de la aceleración.

Aplicación

Una canica de masa m cuelga de una soga sin masa y se halla en el punto

más bajo. Mediante una fuerza horizontal F es separada con rapidez constante de su punto de equilibrio. Si la tensión en la soga es T, determinar el valor de la fuerza F.

En este ejemplo hay que ser cuidadosos en entender que significa rapidez constante. En muchos libros de texto, el problema viene planteado de esta

manera. Sin embargo, hay que entender dos cosas:

(1) Dado que la velocidad es un vector tangente a la trayectoria, esta no tiene posibilidad de mantenerse constante (salvo su módulo o rapidez). Esto solo

podría ocurrir en una trayectoria recta.

(2) El problema planteado de esta forma solo podría estar refiriéndose a velocidad angular constante. En definitiva, lo cierto es que la masa m tiene un

vector velocidad que varía en el tiempo, es decir, está acelerada. La aceleración que posee la masa es la aceleración centrípeta.

La segunda ley de Newton nos dice que T + W + F = mac. Elijamos la base canónica B={i, j}. En esta base, la ecuación anterior se escribe como:

-T seni + T cosj – W j + F i = m(-ac seni + ac cosj)

Nótese que como la aceleración centrípeta apunta radialmente hacia el centro (como la tensión), se descompone igual que esta.

La ecuación vectorial anterior se desacopla en un sistema de dos ecuaciones escalares. Siguiendo los pasos de la aplicación anterior obtenemos:

24

-T sen+ F = -mac sen

T cos- W = mac cos

Multiplicando la primera ecuación por cos, la segunda por seny sumando miembro a miembro se obtiene:

F cos- W sen

De donde resulta F = W tany como F = Fi entonces: F = W tan i. Por otro lado, de la segunda ecuación en el sistema: T = mac + W/cosrecordar que ac=v2/R, si la velocidad de subida y el radio de la cuerda son datos).

Sea ahora una nueva base ortonormal B’={𝒆∧

𝒓, 𝒆∧

𝒕}, definida por un versor 𝒆∧

𝒓 en

la dirección radial y otro 𝒆∧

𝒕 en la dirección tangencial a la trayectoria de la canica en sentido antihorario.

Vamos a escribir los vectores de las fuerzas en la base ortogonal teniendo en

cuenta los ángulos.

La suma de fuerzas T + W + F = mac se puede escribir en esta base como:

-T 𝒆∧

𝒓 + W cos𝒆∧

𝒓W sen𝒆∧

𝒕F sen𝒆∧

𝒓F cos𝒆∧

𝒕mac 𝒆∧

𝒓

Multiplicando escalarmente por 𝒆∧

𝒓 y 𝒆∧

𝒕 se obtienen las ecuaciones escalares:

-T + W cos+ F sen= -mac

-W sen+ F cos= 0

25

De la última ecuación se obtiene F = W tan y remplazando F en la primera

queda:

T = mac + W/cos

Idéntico a lo que se obtuvo en el caso de la elección de la base canónica. La

pregunta es inevitable: ¿cuál de las dos bases conviene usar? La respuesta es

la segunda, pues si bien arroja el mismo resultado, permite expresar la

aceleración en una sola componente, lo cual simplifica el cálculo cinemático

posterior. Aclaración: Solo en el caso que se indique que el cuerpo se mueve

cuasi-estáticamente, se debe tomar ∑F = 0.

Aplicación

Un bloque de masa m se deja caer desde la parte más alta de una semiesfera

de radio R. Entre el bloque y la semiesfera existe roce con coeficiente de roce

. Hallar la ecuación diferencial que rige el movimiento del bloque.

Al deslizarse sobre la semiesfera, la masa acelera y su aceleración se puede

descomponer en aceleración radial aR (la aceleración centrípeta) y at (la

aceleración tangencial). Llamemos al ángulo entre el vector posición y la

vertical. Sean N, fR y W las fuerzas que actúan sobre el bloque.

Aplicando la segunda ley de Newton resulta:

N + fR + W = ma

Definimos una base ortonormal B={er,et} y escribimos la segunda ley de

Newton en esa base.

N er + fR et - mg coser - mg senet = -mar er - mat et

Multiplicando escalarmente por er y et respectivamente se obtiene:

N - mg cos= -mar

fR - mg sen=-mat

26

Como fR=se tiene:

fR = (mg cos- mar)

Reemplazando fR:

(mg cos- mar) - mg sen=-mat

ar + g(sencos) = at

Por otro lado:

𝑎𝑡 =𝑑𝑣

𝑑𝑡=

𝑑𝑣

𝑑𝜃

𝑑𝜃

𝑑𝑡=

𝑑𝑣

𝑑𝜃𝜔 =

𝑑𝑣

𝑑𝜃

𝑣

𝑅=

1

2𝑅

𝑑𝑣2

𝑑𝜃 , 𝑎𝑟 =

𝑣2

𝑅

Reemplazando el valor de las aceleraciones:

1

2𝑅

𝑑𝑣2

𝑑𝜃= 𝑔(𝑠𝑒𝑛𝜃 − 𝜇𝑐𝑜𝑠𝜃) + 𝜇

𝑣2

𝑅

Llamando v2/2R = u y remplazando se obtiene la ecuación diferencial

requerida:

𝑑𝑢2

𝑑𝜃− 2𝜇𝑢 = 𝑔(𝑠𝑒𝑛𝜃 − 𝜇𝑐𝑜𝑠𝜃)

Suma directa de espacios vectoriales

Definición: Sea V un K espacio vectorial y sean S y T subespacios de V.

Definimos la suma de S y T como el subespacio S + T = 〈S,T〉. En el caso en que S ∩ T = {0}, es decir que el único elemento en común entre los dos espacios

es el vector nulo, decimos que la suma es directa y notamos:

S + T = S ⊕ T

Para una suma común, la dimensión del subespacio suma se calcula a partir

de:

dim(S+T) = dim(S) + dim(T) – dim(S∩T)

Ejemplo: Sean los subespacios formados por los planos xy y xz, (tienen como

intersección al eje x) que los denotaremos como Vxy(R) y Vyz(R) (ambos planos, es decir de dimensión 2) respectivamente. Puesto que Vxy(R)∩Vxz(R)=Vx(R) (una recta de dimensión 1), la dimensión de la suma es:

dim(Vxy(R)+ Vxz(R)) = dimVxy(R) + dimVxz(R) - dimVxy(R)∩Vxz(R) = 2+2-1 = 3

27

Considerando cada uno de las tres rectas que definen los ejes x, y, z como

variedades de un mismo tipo de subespacio vectorial, los denotaremos como Vx(R), Vy(R) y Vz(R). La suma directa de estos subespacios vectoriales de dimensión unitaria es factible debido a que se cumple la condición que el

único elemento que tienen en común es el punto {0}, es decir que:

Vx(R)∩Vy(R)∩Vz(R) = {0}

En general, sean S y W subespacios. Si la intersección entre S y W es el subespacio trivial (es decir, el vector nulo), entonces a la suma se la llama “suma directa”. Es decir que si:

S ∩ W = {0} ⇒ S ⊕ W.

Entonces, puesto que dim(S∩W)=0 obtenemos la Fórmula de Grassmann:

dim(S⊕W) = dim(S) + dim(W)

Esto significa que todo vector de S+W, se escribe de manera única como la suma de un vector de S y otro de W. Esto significa que dado sϵS y wϵW,

entonces s+w es único. La suma directa de los tres subespacios vectoriales Vx, Vy y Vz da como resultado el espacio Euclídeo R3:

Vx(R) ⊕Vy(R) ⊕Vz(R)=R3

Cualquier vector vϵR3 se puede escribir como la suma de tres vectores que

pertenecen a cada uno de los subespacios Vx(R), Vy(R) y Vz(R). Tómese en cuenta que:

dim(Vx(R) ⊕Vy(R) ⊕Vz(R))=dim(Vx(R))+dim(Vy(R))+dim(Vz(R))=1+1+1 =3.

Los vectores de norma unitaria se los llama versores.

Versor asociado a un vector

Con frecuencia resulta conveniente disponer de un vector unitario que tenga

la misma dirección que un vector dado v. A tal vector se le llama versor

asociado al vector v y se puede representar por 𝐯⋀. La operación que permite

hallar 𝐯⋀ es la división del vector por su módulo:

𝐯⋀

=𝐯

||𝐯||

Al proceso de obtener un versor asociado a un vector se le conoce como normalización del vector, razón por la cual es común referirse a un vector unitario como vector normalizado.

https://es.wikipedia.org/wiki/Suma_directa

28

||𝑣∧

|| = ||𝑣

||𝑣|||| = √(

𝑣𝑥||𝑣||

)2 + (𝑣𝑦

||𝑣||)2 + (

𝑣𝑧||𝑣||

)2 =1

||𝑣||√𝑣𝑥2 + 𝑣𝑦2 + 𝑣𝑧2 =

||𝑣||

||𝑣||= 1

El método para transformar una base ortogonal (obtenida, por ejemplo

mediante el método de ortogonalización de Gram-Schmidt) en una base ortonormal (es decir, una base en la que todos los vectores son versores) consiste simplemente en normalizar todos los vectores de la base utilizando la

ecuación anterior. Los vectores de norma unitaria se los llama versores. Por ejemplo, i, j, k se los

llama versores canónicos. Producto vectorial

Sean dos vectores a y b en el espacio vectorial R3. El producto vectorial entre

a y b da como resultado un nuevo vector, c. El producto vectorial entre a y b se denota mediante axb, por ello se lo llama también producto cruz. En los textos manuscritos, para evitar confusiones con la letra x (equis), es frecuente

denotar el producto vectorial mediante: a ∧ b. El producto vectorial puede definirse de una manera más compacta de la siguiente manera:

axb = ||𝐚|| ||𝐛|| senθ 𝐧⋀

donde 𝐧⋀ es el vector unitario y ortogonal a los vectores a y b, y su dirección

está dada por la regla de la mano derecha, y θ es, como antes, el ángulo entre a y b. A la regla de la mano derecha se la llama a menudo también regla del tirabuzón.

El producto vectorial cumple:

- el módulo de ||𝐚 x 𝐛 || = 𝑎 𝑏senθ, en donde θ es el ángulo orientado formado

por los vectores a y b y equivale al área del paralelogramo que forman a y b. Es por eso que si a y b son paralelos o antiparalelos, la norma del producto vectorial es nula porque el área de dicho paralelogramo en ambos casos es

nula (además, θ es cero o 180° con lo que la función seno se anula). - el vector axb es perpendicular a cada uno de los vectores a y b. - la dirección del vector axb respecto a los vectores a y b es igual que la del eje coordenado Oz respecto a los ejes coordenados Ox y Oy, como si girase de Ox a Oy y avanzase en la dirección positiva de Oz.

Sean los vectores concurrentes u,v de R3, el espacio tridimensional, según la base canónica. Se define el producto:

u = uxi + uyj + uzk; v = vxi + vyj + vzk; w = wxi + wyj + wzk

29

Donde w es el producto vectorial de u y v, definido así:

x: R3 x R3 → R / (u ; v) → w = uxv

donde la última fórmula se interpreta como:

w = uxv = (uyvz-uzvy)i + (uzvx-uxvz)j + (uxvy-uyvx)k

Es decir:

wx = uyvz -uzvy; wy = uzvx-uxvz; wz = uxvy-uyvx

Usando una notación más compacta, mediante el desarrollo por la primera

fila de un determinante simbólico de orden 3 (simbólico ya que los términos de la primera fila no son escalares):

uxv = det[(i,j,k);(ux,uy,uz);(vx,vy,vz)] Ejemplo: El producto vectorial axb de los vectores a = (2; 0; 1) y b = (1;-1; 3) se calcula del siguiente modo:

axb = (0*3-1*(-1)) i - (2*3-1*1) j + (2*(-1)-0*1) k ⇒ axb = i-5j-2k

Propiedades del producto vectorial

Identidades

Cualesquiera que sean los vectores a, b y c : 1. axb = -(bxa), anticonmutatividad. 2. a ∙ (axb) = 0, cancelación por ortogonalidad.

3. Si axb = 0 con a≠0 y b≠0 ⇒ a ∥ b; esto es, la anulación del producto vectorial proporciona la condición de paralelismo entre dos direcciones. 4. (a + b)xc = axc + bxc.

5. ax(bxc) = b(a∙c) - c(a∙b), conocida como regla de la expulsión. 6. ax(bxc) + cx(axb) + bx(cxa) = 0,conocida como identidad de Jacobi.

7. |axb|= |a||b|sin θ, en la expresión del término de la derecha, sería el módulo de los vectores a y b, siendo θ, el ángulo menor entre los vectores a y b ;esta expresión relaciona al producto vectorial con el área del paralelogramo que definen ambos vectores.

8. El módulo o norma del producto vectorial puede calcularse fácilmente sin hacer el producto vectorial:

∥axb∥ = [∥a∥2∥b∥2-(a∙b)2)]1/2

30

9. El vector unitario:

𝐧⋀

=𝐚x𝐛

∥ 𝐚x𝐛 ∥

es normal al plano que contiene a los vectores a y b.

10. axa = 0. 11. ax(bxc) ≠ (axb)xc, no es asociativo. 12. (axb) = (a)xb = ax(b), asociatividad respecto del factor escalar.

Bases ortonormales y producto vectorial

Sea un sistema de referencia S = f{O; i; j; k} en el espacio vectorial R3. Se dice que S es una base ortonormal derecha si cumple con las siguientes condiciones:

1. i∙j = j∙k = k∙i = 0; es decir, los tres vectores son ortogonales entre sí.

2. ||𝐢|| = ||𝐣|| = ||𝐤|| = 1; es decir, los vectores son vectores unitarios (y por lo

tanto, dada la propiedad anterior, son ortonormales).

3. i x j = k, j x k = i, k x i = j; es decir, cumplen la regla de la mano derecha.

Aplicación

En la física del cuerpo rígido se presenta a menudo el problema de calcular el

torque efectuado por una fuerza F en un punto P del sólido. Definiendo un sistema de referencia equipado con una bon, quedan establecidas las magnitudes vectoriales F, r (la posición del punto P) y

El torque respecto al origen O, efectuado por la fuerza F aplicada en el punto

P viene dado por:

Fr x F Como ejemplo, calculemos el torque total (la suma de los torques) producidos sobre una placa cuadrada de lado a por las fuerzas F, S y T como se muestra

en la figura con las posiciones de los puntos de aplicación de las fuerzas.

31

Es decir:

∑F+ S+ T= 0 x F rSx SrTx T Si elegimos la base de R3 B={(1,0,0),(0,1,0),(0,0,1)}, los vectores se escriben:

F = (0,F,0), T = (Tsenθ,Tcosθ,0), S = (S,0,0), rT = (a,0,0) y rS = (a,a,0)

Remplazando en la suma de los torques respecto de O resulta:

∑aT cos- aS) k Puesto que el eje z apunta entrando al plano del papel, entonces si:

aT cos- aS > 0

∑entra al plano, mientras que si:

aT cos- aS

32

A diferencia de la base canónica, 𝒆∧

𝒓 y 𝒆∧

𝒕 dependen del tiempo. El versor 𝒆∧

𝒓 rota

apuntando hacia la partícula que está rotando, el versor 𝒆∧

𝒕 (que es

perpendicular a 𝒆∧

𝒓) se mantiene tangente a la trayectoria, mientras que el

versor 𝒆∧

𝒛 equivale al versor k. El vector posición de la partícula se puede

escribir en esta base como r = r 𝒆∧

𝒓 y su velocidad v = v 𝒆∧

𝒕. Dado que el módulo de la velocidad angular se define como t, multiplicando y dividiendo por r se obtiene rrt.

Pero rrepresenta el arco s = rde circunferencia recorrido por la partícula, de modo que s/rt. Como s/t=v (la rapidez de la partícula), resulta que el módulo de la velocidad angular es v/r, por lo tanto:

v =r Con esto, se puede definir el vector velocidad angular como:

v =x rReemplazando resulta:

v 𝒆∧

𝒕 =x r𝒆∧

𝒓

Multiplicando vectorialmente a izquierda por 𝒆∧

𝒓

𝒆∧

𝒓 x (v 𝒆∧

𝒕) =𝒆∧

𝒓 xx r𝒆∧

𝒓)

v (𝒆∧

𝒓 x 𝒆∧

𝒕) = r (𝒆∧

𝒓 xx 𝒆∧

𝒓))

33

Pero 𝒆∧

𝒓 x 𝒆∧

𝒕= 𝒆∧

𝒛, entonces:

v 𝒆∧

𝒛 = r (𝒆∧

𝒓 xx 𝒆∧

𝒓))

Usando la identidad vectorial ax(bxc) = b (a∙c) – c (a∙b) resulta:

𝒆∧

𝒓 xx𝒆∧

𝒓) =(𝒆∧

𝒓∙𝒆∧

𝒓)𝒆∧

𝒓 (𝒆∧

𝒓∙

Como 𝒆∧

𝒓∙𝒆∧

𝒓 = 1 y 𝒆∧

𝒓∙𝒆∧

𝒓y son perpendiculares) queda finalmente:

v 𝒆∧

𝒛 = rEs decir:

v/r) 𝒆∧

𝒛 Que es la expresión vectorial de la velocidad angular. El vector velocidad

angular es perpendicular a la órbita de la partícula, y su módulo es v/r. Notar que si la rapidez es constante, el módulo de la velocidad angular es constante. Si por ejemplo, la rapidez aumenta con aceleración constante en un intervalo

de tiempo Δt, también lo hace y por ello ΔΔt será la aceleración angular

Matriz de Rotación

En álgebra lineal, una matriz de rotación es la matriz que representa una

rotación en el espacio Euclídeo. Por ejemplo, la matriz:

R(θ)=(cos θ − sin θ sin θ cos θ

)

representa la rotación de ángulo θ del plano en sentido antihorario. En tres dimensiones, las matrices de rotación representan las rotaciones de manera

concisa y se usan frecuentemente en geometría, Física e informática. Aunque en la mayoría de las aplicaciones se consideran rotaciones en dos o tres dimensiones, las matrices de rotación pueden definirse en espacios de

cualquier dimensión. Algebraicamente, una matriz de rotación es una matriz ortogonal de determinante uno: RT = R−1 y detR = 1. Las matrices de rotación

son cuadradas y con valores reales. Sin embargo, se pueden definir sobre otros cuerpos. El conjunto de todas las matrices de rotación de dimensión n×n forma un grupo que se conoce como grupo de rotaciones (o grupo ortogonal

especial). El grupo ortogonal especial, abreviado usualmente SO(n), es un grupo de Lie y se puede identificar con el grupo de rotaciones en el espacio Rn.

Para rotar vectores columna, estos se multiplican por la matriz de rotación en la siguiente forma:

(𝑥′𝑦′

) = (cos θ − sen θsen θ cos θ

) (𝑥𝑦)

34

Así las coordenadas (x',y') del punto (x,y) después de la rotación son:

x′ = x cos θ − y sen θ y′ = x sen θ + y cos θ

La dirección del vector rotado es antihoraria si θ es positiva (por ejemplo 90°), y tiene sentido horario si θ es negativo (por ejemplo −90°). Por lo tanto la matriz

de rotación horaria es:

R(-θ) = ( cos θ sin θ −sin θ cos θ

)

La matriz anterior, se obtiene cambiando θ por – θ y teniendo en cuenta que cos(-θ) = cosθ y sen(-θ) = -senθ.

Ejemplo: Rotar al vector (1, 0, 0) 90° en sentido antihorario.

R(90°) = ( 0 − 1 1 0

) (10

) = (01

)

Rotaciones básicas

Las siguientes matrices de rotación realizan rotaciones de vectores alrededor de los ejes x, y, o z, en el espacio de tres dimensiones:

Para un eje de rotación arbitrario definido por un vector v, existe una matriz de rotación general para una rotación de un ángulo θ. Cada una de estas tres rotaciones básicas se realiza en sentido antihorario alrededor del eje y

considerando un sistema de coordenadas con la regla de la mano derecha.

35

Notar que las matrices de rotación preservan la norma. Sea r=(x,y)ϵR2 tal que su norma es:

||𝐫|| = √𝐫 • 𝐫 = √𝑥2 + 𝑦2

Vamos a calcular la norma del vector transformado r’, donde:

r’ = (x′, y′) = (x cos θ − y sin θ, x sin θ + y cos θ)

Notar que r’• r’ = (x cos θ –y sin θ)2 + (x sin θ + y cos θ)2 = x2+y2, entonces la norma del vector transformado es:

||𝐫′|| = √𝐫′ • 𝐫′=√𝑥2 + 𝑦2 Es decir:

||𝐫′|| = ||𝐫|| Se dice entonces que la rotación preserva la norma.

Aplicación

La matriz de rotación tiene otra interpretación en lo que a sistemas de referencia se refiere. Como ya vimos, R(θ) aplicada sobre un vector v=(x,y) rota al vector v en un ángulo θ en sentido antihorario dando el vector rotado v’=(x’,y’), visto en el sistema de referencia original. Sin embargo podemos considerar que el vector v queda fijo y el sistema de referencia ha rotado un ángulo θ en sentido horario. Esto es, si rotamos el sistema, el vector v’ visto en el nuevo sistema de referencia formará un ángulo + θ respecto al nuevo sistema. Así, un vector que formaba un ángulo con el eje x, después de la transformación formará un ángulo + θ, con el eje x.

Es decir, que si la trayectoria de un móvil viene dada por el vector de posición

r(t), bajo una rotación en el sistema de referencia de un ángulo θ en sentido horario, las coordenadas del vector posición vistas en el nuevo sistema serán:

r’(t) = R(θ) r(t)

36

Cálculo diferencial Newton y Leibniz

A finales del siglo XVII se sintetizaron en dos conceptos los algoritmos usados

por sus predecesores, en lo que hoy llamamos «derivada» e «integral». La historia de la matemática reconoce que Sir Isaac Newton y Gottfried Leibnitz son los creadores del cálculo diferencial e integral. Ellos desarrollaron reglas

para manipular las derivadas (reglas de derivación) e Isaac Barrow demostró que la derivación y la integración son operadores inversos. Newton desarrolló en Cambridge su propio método para el cálculo de

tangentes. En 1665 encontró un algoritmo para derivar funciones algebraicas que coincidía con el descubierto por Fermat. A finales de 1665 se dedicó a

reestructurar las bases de su cálculo, intentando desligarse de los infinitesimales, e introdujo el concepto de fluxión, que para él era la velocidad con la que una variable «fluye» (varía) con el tiempo. Gottfried Leibniz, por su

parte, formuló y desarrolló el cálculo diferencial en 1675. Fue el primero en publicar los mismos resultados que Isaac Newton descubriera 10 años antes.

En su investigación conservó un carácter geométrico y trató a la derivada como un cociente incremental y no como una velocidad, viendo el sentido de su correspondencia con la pendiente de la recta tangente a la curva en dicho

punto. Leibniz es el inventor de diversos símbolos matemáticos. A él se deben los nombres de: cálculo diferencial y cálculo integral, así como los símbolos de

derivada. Derivada

Sea f: R→R una función definida por y=f(x). Sea un punto x cualquiera y f(x)

el valor de la función en ese punto. Sea x un incremento en la variable x, el valor de la función en el punto x+x, será f(x+x). Definamos los puntos P y Q1 como P≡(x, f(x)) y Q1≡(x+x, f(x+x)) los cuales definen una recta secante a la curva definida por la función.

37

Imaginemos el siguiente proceso: Primero veamos que el punto Q1 depende de x y x. Si consideramos que x está fijo (como consecuencia el punto P permanece fijo), entonces Q1 depende solo de x. Supongamos que el incremento x se hace en forma continua más pequeño definiendo así al punto Q2. Luego x se hace más pequeño aun, definiendo al punto Q3. Notar que en definitiva, hacer más pequeño a x no es otra cosa que hacer tender Q hacia P. Si x tiende a cero, entonces Q tiende a P. Así como sobre el eje x, queda determinado un segmento de longitud x, en el eje y queda determinado un segmento de longitud f(x+x)-f(x). ¿Cuál es el significado geométrico del proceso anterior? Las rectas que pasan por P y cualquiera de los Qj son rectas secantes a la curva. Sin embargo, en el

límite cuando x es cero, el cambio es dramático. De todas las rectas de la familia generada para cada valor de x≠0, solo la última (x=0) pierde el status de recta secante para transformarse en una recta tangente a la curva en el punto x. Para la recta secante a la curva que pasa por P y Q1, la pendiente es:

𝑚 =𝑓(𝑥 + Δx) − 𝑓(𝑥)

Δx

En particular, cuando x tienda a cero (x→0), entonces m tenderá a un valor límite que no será otra cosa que el valor de la pendiente de la recta tangente a la curva en el punto x. Este valor límite de la pendiente se llama derivada de

la función f(x) en el punto x y se denota por f ’(x):

𝑓′(𝑥) = 𝑙í𝑚𝛥𝑥→0

𝑓(𝑥 + 𝛥𝑥) − 𝑓(𝑥)

𝛥𝑥

Esto quiere decir que para cada punto de la función que tenga una recta tangente, esta recta tendrá una pendiente dada por la ecuación anterior, que da un valor genérico que depende en general de la variable x.

38

En particular, cuando el valor de x es un valor definido (x=x0), La notación es f ’(x0) ó f ’(x)|x=x0 (hay otras notaciones pero las veremos más adelante). Propiedades de la derivada

1) Linealidad de la derivada: Sea f(x)=ap(x)+bq(x) / a,bϵR.

f(x+x)=ap(x+x)+bq(x+x)


1

𝛥𝑥{(𝑎𝑝(𝑥 + 𝛥𝑥) + 𝑏𝑞(𝑥 + 𝛥𝑥) − [𝑎𝑝(𝑥) + 𝑏𝑞(𝑥)]}


1

𝛥𝑥{𝑎[𝑝(𝑥 + 𝛥𝑥) + 𝑝(𝑥)] + 𝑏[𝑞(𝑥 + 𝛥𝑥) − 𝑞(𝑥)]}


𝑎[𝑝(𝑥 + 𝛥𝑥) + 𝑝(𝑥)]

𝛥𝑥+ 𝑙í𝑚

𝛥𝑥→0

𝑏[𝑞(𝑥 + 𝛥𝑥) − 𝑞(𝑥)]

𝛥𝑥

𝑓′(𝑥) = 𝑎𝑝′(𝑥) + 𝑏𝑞′(𝑥)

Esto significa que el operador derivada es lineal.

2) Derivada de una constante: Sea f(x)=c con cϵR. Como la función es

constante no se ve incrementada por x, es decir f(x+x)=c.

𝑓′(𝑥) = límΔx→0

𝑐−𝑐

Δx= lím

Δx→0

0

Δx=0

3) Derivada de una función lineal: Sea f(x)=ax+b.


𝑎(𝑥 + 𝛥𝑥) + 𝑏 − (𝑎𝑥 + 𝑏)

𝛥𝑥= 𝑙í𝑚

𝛥𝑥→0

𝑎𝑥 + 𝑎𝛥𝑥 + 𝑏 − 𝑎𝑥 − 𝑏)

𝛥𝑥


𝑎𝛥𝑥

𝛥𝑥= 𝑙í𝑚

𝛥𝑥→0𝑎 = 𝑎

𝑓′(𝑥) = 𝑎

4) Derivada de una función potencial: Usando la fórmula del binomio de Newton se puede demostrar que si f(x)=xn entonces: f ’(x)=nxn-1.

39

¿Qué significa geométricamente obtener la derivada de una función? Para contestar esta pregunta, es necesario tener en cuenta que la derivada obtenida

también es una función, y que como tal arroja un valor después de especializar la variable x en un punto determinado. El valor obtenido de la función (la derivada) es justamente la pendiente (inclinación) de la curva dada.

Ejemplo: Sea la función f(x)=-2x2+4 entonces f’(x)=-4x. Por lo tanto, esta función da la pendiente de f(x) para cualquier punto. Deseamos saber que inclinación tiene f(x) en x=-1, x=0, x=1. Basta con remplazar los valores de x en la derivada: f ’(-1)=4, f ’(0)=0 y f ’(1)=-4. Esto significa que en x=-1, la función f’(x)=-4x vale 4, entonces la inclinación de f en -1 es 4. En x=0, como f’(0)=0 la inclinación de la curva es cero. En x=1, f’(1)=-4 la función tiene pendiente negativa. Si trazamos una recta tangente a f(x) en x=-1 su pendiente será m=4 (tan=4).

Dada una función f(x), con la función derivada especializada en x=x0, hallamos la pendiente de la recta tangente a f(x) en ese punto. La ecuación de la recta, dada su pendiente m y un punto (x0,y0) que pertenece a ella, viene dada por:

y=m(x-x0)+y0 Como m=f ’(x0) y y0=f(x0), remplazando en la ecuación de la recta se obtiene:

y= f ’(x0) (x-x0)+ f(x0)

En el caso de la función del ejemplo, son puntos son: (-1,2), (0,4) y (1,2), y las

pendientes como ya vimos son: 4, 0 y -4. Las rectas tangentes a la curva en esos puntos son: y=4x+6, y=4, y=-4x+6.

40

Notar que la recta tangente a la función en x=0 tiene pendiente nula; esto

será motivo de estudio en los párrafos siguientes.

Continuidad y diferenciabilidad

Una condición necesaria pero no suficiente para que una función sea derivable

en un punto es que esta sea continua. Intuitivamente, una función continua es aquella en la cual pequeños incrementos en los elementos del dominio de la variable dependiente produce pequeños incrementos en el valor de dicha

función, de manera que:

f(x + Δx) = y + Δy Haciendo estos incrementos cada vez más pequeños, las variaciones se hacen

más pequeñas. Cuando estos se aproximan a cero, en el límite:

límΔ𝑥→0

𝑓(𝑥 + Δ𝑥) − 𝑦 = 0

De lo que se obtiene f(x)=y. Para un punto particular x=a, quiere decir que:

lím𝑥→𝑎

𝑓(𝑥) = 𝑓(𝑎)

Y si este último límite existe significa, en consecuencia por un teorema de

límites (un límite existe si y sólo si los dos límites laterales existen y son iguales), que toda función f(x) que cumpla con:

lím

𝑥→𝑎+𝑓(𝑥) = lím

𝑥→𝑎−𝑓(𝑥) = lím

𝑥→𝑎𝑓(𝑥) = 𝑓(𝑎)

es continua en el punto a. Como consecuencia lógica, toda función derivable en el intervalo abierto I, es continua en I. Llamemos L+ y L- a los límites laterales:

𝐿+ = Lím𝑥→𝑎+

𝑓(𝑥) 𝑦 𝐿− = Lím𝑥→𝑎−

𝑓(𝑥)

41

Cuando una función es discontinua, los límites laterales son distintos y

entonces se dice que el límite en x=a no existe. La relación no funciona a la inversa: el que una función sea continua no garantiza su derivabilidad. Es posible que los límites laterales sean iguales

pero las derivadas laterales no; en este caso concreto, la función presenta un punto anguloso en dicho punto. El hecho que la función sea continua y la derivada no lo sea, indica que la función no está “cortada” pero tiene un salto

en la pendiente. Un ejemplo — recurrente en la literatura usual — puede ser la función valor absoluto (también llamada módulo) en el punto (0; 0). Dicha función se expresa:

|x| = x si x ≥ 0 y |x| = –x si x

42

Aunque podrían calcularse todas las derivadas empleando la definición de derivada como un límite, existen reglas bien establecidas, conocidas como

teoremas para el cálculo de derivadas, las cuales permiten calcular la derivada de muchas funciones de acuerdo a su forma sin tener que calcular forzosamente el límite. Tales reglas son consecuencia directa de la definición

de derivada y de reglas previas, como puede apreciarse en todo buen texto de cálculo infinitesimal. La notación de Newton para la diferenciación respecto al tiempo, era poner un punto arriba del nombre de la función, en la segunda

derivada dos puntos y así sucesivamente:

𝑥.

=𝑑𝑥

𝑑𝑡= 𝑥′(𝑡) 𝑥

..=

𝑑2𝑥

𝑑𝑡2= 𝑥''(𝑡)

Se lee «punto x» o «x punto». Actualmente está en desuso en Matemáticas puras, sin embargo se sigue usando en áreas de la física como la mecánica, donde otras notaciones de la derivada se pueden confundir con la notación de

velocidad relativa. Se usa para definir la derivada temporal de una variable. Esta notación de Newton se usa principalmente en mecánica, normalmente para derivadas que involucran la variable tiempo como variable independiente,

tales como velocidad y aceleración, y en teoría de ecuaciones diferenciales ordinarias. Usualmente solo se emplea para las primeras y segundas

derivadas. Otra notación común para la diferenciación es debida a Leibniz. Para la función derivada de f, se escribe: df(x)/dx. También puede encontrarse como dy/dx, df/dx. Esta notación tiene la ventaja de sugerir a la derivada de una función con

respecto a otra como un cociente de diferenciales. Con esta notación, se puede escribir la derivada de f en el punto a de dos modos diferentes:

df(x)/dx|x=a = df(a)/dx

Si y=f(x) la derivada se expresa como dy/dx y las derivadas enésimas como dny/dxn . La notación más simple para diferenciación, en uso actual, es debida a Lagrange. Para identificar las derivadas de f en el punto a, se escribe: - f′(a) para la primera derivada. - f′′(a) para la segunda derivada. - f′′′(a) para la tercera derivada.

- f(n)(a) para la enésima derivada (n>3). (También se pueden usar números romanos.)

Y por último, también se utiliza Dxf o ∂xf (notaciones de Euler y Jacobi, respectivamente), y los símbolos D y ∂ deben entenderse como operadores

diferenciales. Mini tabla de derivadas

La siguiente, es una tabla adecuada para las necesidades para el estudiante de Física que recién comienza.

f(x)=c ⇒ f ’(x)=0

43

f(x)=xn ⇒ f ’(x)=n xn-1

f(x)=ex ⇒ f ’(x)= ex

f(x)=ax ⇒ f ’(x)=ln(a) ax

f(x)=ln(x) ⇒ f ’(x)=1/x

f(x)=loga(x) ⇒ f ’(x)=1/x ln(a)

f(x)=sen(x) ⇒ f ’(x)=-cos(x)

f(x)=cos(x) ⇒ f ’(x)=sen(x) Aplicación

Sea un móvil que se mueve en una dirección (eje x) con ecuación de posición: x(t)=x0+vt

En el espacio unidimensional de la posición, también debemos elegir una base del espacio B={i}. En este caso no tiene sentido hablar de ortonormal, ya que

no hay perpendicularidad entre vectores de la base. En esta base, la ecuación se escribe como x(t)i=x0i+vti, y multiplicando escalarmente por i resulta:

x(t)=x0 +vt Esta ecuación es una ecuación paramétrica, pues depende del parámetro t. Cuando el conjunto de ecuaciones paramétricas es unitario, es útil obtener un espacio de dimensión mayor, formado por el producto cartesiano entre el

espacio unidimensional de la posición con el tiempo.

R2espacio-tiempo=Respacio x Rtiempo

Sea f:D→R, x0ϵD/(x0-δ,x0+ δ)⊂D. Se dice que f tiene un máximo local (relativo) en x0 si f(x)≤f(x0) ∀ xϵ(x0-δ,x0+ δ) para algún δ>0. Por otro lado, se dice que f tiene un mínimo local (relativo) en x0 si f(x)≥f(x0) ∀ xϵ(x0-δ,x0+ δ) para algún δ>0. En general, se dice que f tiene un extremo local en x0 si tiene un máximo o mínimo local en x0. Para saber si el extremo es un máximo o un mínimo se ve si f

’’(x0)0 respectivamente. Teorema de Fermat

Sea f:(a,b)→R y xoϵ(a,b). Si f es derivable en x0 y tiene un extremo en x0, entonces:

f ’(x0)=0

Teorema de Rolle

Sea f:[a,b]→R continua y derivable en (a,b). Si f(a)=f(b) entonces:

44

∃ c ϵ (a,b)/f ’(c)=0

Ecuaciones paramétricas

En matemáticas, un sistema de ecuaciones paramétricas permite representar una curva o superficie en el plano o en el espacio, mediante una variable

llamada parámetro, que toma valores que recorren un intervalo de números reales, considerando cada coordenada de un punto como una función dependiente del parámetro:

x=x(t) ; y=y(t) ; z=z(t);…

Un ejemplo simple de la cinemática es cuando se usa un parámetro de tiempo (t) para determinar la posición y la velocidad de un móvil.

En el uso estándar del sistema de coordenadas, una o dos variables (dependiendo de si se utilizan dos o tres dimensiones respectivamente) son consideradas como variables independientes, mientras que la restante es la

variable dependiente, con el valor de ésta siendo equivalente al de la imagen de la función cuando los restantes valores son sus parámetros. Así, por

ejemplo, la expresión de un punto cualquiera (x, y) equivale a la expresión (x,f(x)). Esta representación tiene la limitación de requerir que la curva sea una función de x en y, es decir que todos los valores x tengan un valor y sólo un valor correspondiente en y. No todas las curvas cumplen con dicha condición. Para poder trabajar con la misma como si se tratara de una función, lo que se hace es elegir un dominio y una imagen diferentes, en donde la misma sí sea función. Para hacer esto, tanto x como y son considerados variables dependientes, cuyo resultado surge de una tercera variable (sin representación gráfica) conocida como «parámetro».

La representación paramétrica de una curva en un espacio n-dimensional consiste en n funciones de una variable t, que en este caso es la variable independiente o parámetro (habitualmente se considera que t es un número real y que los puntos del espacio n-dimensional están representados por n coordenadas reales), de la forma xi = fi(t), fi : [a, b] → R , donde xi representa la i-ésima coordenada del punto generado al asignar valores del intervalo [a,b] a t. Por ejemplo, para representar una curva en el espacio se usan 3 funciones x = x(t), y = y(t), z = z(t). Es común que se exija que el intervalo [a, b] sea tal que a cada punto a ≤ t < b le corresponda un punto distinto de la curva; si las

coordenadas del punto obtenido al hacer t = a son las mismas del punto correspondiente a t = b la curva se denomina cerrada. Se dice que un punto de la curva correspondiente a un valor t del intervalo es un punto ordinario si las derivadas de las funciones paramétricas existen en y son continuas en ese punto y al menos una es distinta de 0. Si un arco de curva está compuesto

solamente de puntos ordinarios se denomina suave. Es común resumir las ecuaciones paramétricas de una curva en una sola ecuación vectorial de una

variable real (t).

r(t) = ∑ 𝑓𝑗(𝑡)𝒆∧

𝒋

𝑛

𝑗=1 = f1(t) 𝒆

∧

𝟏 + f2(t) 𝒆∧

𝟐 + ··· + fn(t) 𝒆∧

𝒏 ∈ Rn

45

donde 𝒆∧

𝒋 representa al vector unitario correspondiente a la coordenada j-

ésima. Por ejemplo, las funciones paramétricas de un círculo unitario con

centro en el origen son x(t)= cos(t), y(t)= sen(t). Podemos reunir estas ecuaciones como una sola ecuación de la forma:

r(t) = cos(t) i + sin(t) j

siendo B={i,j} la base usual del espacio bidimensional real. Si t recorre el intervalo [0,2π], la curva obtenida es una circunferencia de radio 1. Si t=0 se

obtiene r(0)=i, si t=45° resulta 𝐫(45°) =√2

2𝐢 +

√2

2𝐣, etcétera.

Una función vectorial de una variable real en el espacio es una función cuyo

dominio es un conjunto de números reales y cuyo rango es un conjunto de

vectores del espacio, es decir, es una función del tipo:

))(),(,)(()()()()(

: 3

thtgtfthtgtftt

I

kjir

VRr

donde hgf y, son funciones reales de variable real t , llamadas funciones

componentes de r .

Nota: Si la función vectorial r describe el movimiento de una partícula, el

vector ))(),(,)(()( thtgtft r señala su posición en el instante t . En estos casos

t representa la variable tiempo.

Ejemplos: 1) kjirVRr )1(2)32()(/: 3 tttt

2) )3,,()(/:2

3 tcostsentt rVRr

Dominio de una función vectorial

Está dado por la intersección de los dominios de sus funciones componentes,

es decir, si ))(),(,)(()( thtgtft r entonces:

)()()()( hDomgDomfDomDomI r

Ejemplo: Si tlnttt ,,1)( 2r el dominio de r será 0/ ttI R Límite y continuidad de una función vectorial

Sea la función vectorial ))(),(,)(()(/: 3 thtgtftI rVRr se define:

)(lim,)(lim,)(lim)( thtgtftlimatatatat

r

46

siempre que existan los límites de las funciones componentes.

Ejemplo: Si tettsentt 22,,31)( r entonces:

)1,0,1()(lim,lim,)31(lim)( 220000

t

tttt

ettsenttlim r

Si Ia , se dice que r es continua en a si )()( atlimat

rr

Teniendo en cuenta las definiciones de límite y continuidad resulta:

“La función vectorial ))(),(,)(()( thtgtft r es continua en a si y sólo si sus

funciones componentes hgf y, son continuas en a .”

Representación gráfica de una función vectorial

Sea la función vectorial ))(),(,)(()(/: 3 thtgtftI rVRr

Para cada It se obtiene un vector )(tr , que es el vector posición del punto

))(),(,)(( thtgtfP . Si la función vectorial es continua en I , es decir sus

funciones componentes f, g y h son continuas en I , define una curva C en el

espacio formada por los extremos del vector )(tr donde t varía de a a b.

Entonces la curva C es el conjunto de todos los puntos ),,( zyxP del espacio

tales que:

It

thz

tgy

tfx

con

)(

)(

)(

A estas ecuaciones se las llama ecuaciones paramétricas de la curva C y t es

el parámetro.

Cuando se grafica una curva descrita por una función vectorial )( tr , cada

punto de la misma (extremo del vector )( tr ) queda determinado por un valor

elegido para el parámetro t. Al trazar los puntos resultantes de valores

crecientes de t, la curva se va trazando en una dirección específica. En este

caso se dice que la curva está orientada positivamente.

•

P (f

r t

r(t)

C

t

z

y

x

t

47

Ejemplo: Sea tttt 31,22,3)( r con Rt , como r es continua en R

define una curva C en el espacio. Las ecuaciones paramétricas de C son:

It

tz

ty

tx

con

31

22

3

Estas son las ecuaciones paramétricas de una recta que contiene al punto

)1,2,3(0 P y es paralela al vector )3,2,1.(u .

Derivada de una función vectorial

Definición: Sea r una función vectorial, se define su derivada 'r como:

t

tttlimt

t

)()()('

0

rrr

Siempre que este límite exista.

Interpretación geométrica de la

derivada de una función vectorial

Supongamos que )( tr sea el vector

posición del punto P y )( tt r el vector

posición del punto Q, entonces

PQttt )()( rr se puede

considerar como un vector secante a la

curva C.

Si 0 t el vector:

PQt

tttt

1)()(

1rr

tiene la misma dirección y sentido que el vector PQ . Entonces cuando 0 t

el vector PQt

1 se aproxima a un vector que está en la recta tangente a la

curva C en el punto P. Si 0 t con un razonamiento similar se llega a la

r’(t)

t+∆t

Q

r(t)

P •

r

r(t+∆t) C

t

z

y

x

t t

48

misma conclusión. Por lo que al vector )(' tr se lo denomina vector tangente a

la curva C en el punto P, siempre que )(' tr exista y 0r )(' t .

La recta tangente a la curva C en el punto P es la recta que contiene a P y tiene

la dirección del vector )(' tr .

También se puede considerar el vector tangente unitario )('

)(')(

t

tt

r

rT .

Teorema: Fórmula de cálculo de )(' tr

Sea la función vectorial ))(),(,)(()()()()( thtgtfkthjtgitft r con It

tal que hgf y, son funciones derivables en I, entonces:

))('),(',)('()(')(')(')(' thtgtfkthjtgitft r

Demostración:

)(',)(',)('

)()(,

)()(,

)()(

)()(,)()(,)()(1

)(,)(,)()(,)(,)(1

)()()('

(*)000

0

0

0

thtgtf

t

thtthlim

t

tgttglim

t

tfttflim

thtthtgttgtfttft

lim

thtgtftthttgttft

lim

t

tttlimt

ttt

t

t

t

rrr

La igualdad (*) es válida pues por hipótesis hgf y, son funciones derivables.

Ejemplo: Sea ttsentcost ,,)( r con Rt , vimos que su representación

gráfica es una hélice.

1,,)(' tcostsent r

1,1,01,0,0)0(' cossenr

2

1,

2

1,0

)0('

)0(')0(

r

rT

Las ecuaciones paramétricas de la recta tangente a la hélice en

el punto )0,0,1(P son

R

t

tz

ty

x

con

1

Reglas de derivación

Sean 1r y 2r funciones vectoriales derivables, c un escalar y f una función

real derivable. Entonces

49

a. td

td

td

tdtt

td

d )()()()(

21

21

rrrr

b. tdtd

ctctd

d )()(

1

1

rr

c. tdtd

tfttd

tfdttf

td

d )()()(

)()()(

2

11

rrr

d. tdtd

tttd

tdtt

td

d )()()(

)()()(

2

12

1

21

rrr

rrr

e. tdtd

tttd

tdtt

td

d )()()(

)()()(

2

12

1

21

rrr

rrr

f. )('))((

))((1

1 tftd

tfdtf

td

d

rr

Observación: en c) ”.” indica el producto entre una función real y una

función vectorial, en d) “•”indica producto escalar entre funciones

vectoriales, y en e) “x” es el producto vectorial entre funciones vectoriales.

Definición de distintos tipos de curvas

Sea una curva C la representación gráfica de la función vectorial )( tr con

bat , I • C es una curva simple si batt ,, 21 tal que 21 tt resulta )()( 21 tt rr

Es decir una curva C es simple si no se cruza a sí misma al variar t en ba, . • C es una curva cerrada si )()( ba rr .

• C es una curva suave si )(' tr es continua en ba, y batt ,)(' 0r , es

decir una curva suave no posee puntos angulosos.

• C es una curva seccionalmente suave (suave a trozos o suave por partes) si

está formada por un número finito de arcos de curva suave.

•

•

•

•

•

•

Curvas simples

Curvas no simples

Curva cerrada Curva no cerrada

50

Longitud de un arco de curva

Sea C un arco de curva suave y simple, la representación gráfica de la función

vectorial )( tr con bat , I . Se puede probar que la longitud del arco de curva C viene dada por:

dttLb

a )('r

Ejemplo: Calcular la longitud del arco de curva C definido por la función

vectorial tsentcost ,)( r con 2,0t .

C es un arco de curva suave y simple (¡verificarlo!).

tcostsent ,)(' r

1)(' 22 tcostsentr

2

0

2tdL

Nota: Una curva puede ser descrita por más de una función vectorial. Por

ejemplo, las funciones vectoriales tsentcost ,)(1 r con 2,0t y

usenucosu 2,2)(2 r con ,0u definen la misma curva, una

circunferencia con centro en 0,0 y radio 1. Entonces para una misma curva

se tienen distintas parametrizaciones. Se puede probar que el cálculo de la

longitud de un arco de curva suave y simple es independiente de la

parametrización que se utilice.

Movimientos en el espacio: velocidad y aceleración

Supongamos una partícula que se mueve en el espacio de manera que su

posición en cada instante t de tiempo está dado por el vector )( tr .

El cociente t

ttt

)()( rr nos da la velocidad promedio en un intervalo de

tiempo t .

El vector velocidad )( tv en el tiempo t será )(')()(

)(0

tt

tttlimt

t

rrr

v

C4 C3

C2 C1

Curva seccionalmente suave

51

La rapidez de la partícula en el tiempo t es )(')( tt rv

El vector aceleración )(ta en el tiempo t será )('')(')( ttt rva .

Aplicación

Una partícula es arrojada verticalmente hacia arriba con una velocidad inicial

v0. Estudiar la ecuación de movimiento. Si se coloca un sistema de referencia en el punto de lanzamiento, la ecuación de movimiento es:

y(t)=v0t-½gt2

La gráfica del movimiento es una función cuadrática y viene dada por:

Las posiciones extremales de la función posición vendrán dadas por todos los tS que satisfagan: dy(t)/dt|t=ts=0. En nuestro caso se obtiene:

𝑑𝑦(𝑡)

𝑑𝑡= 𝑣0 − 𝑔𝑡 = 0

De donde t=v0/g. Esto significa que la función x(t) tiene un extremo en t=v0/g.

Además como d2y(t)/dt2=-g

52

Por comodidad y para comparar, se han superpuesto las gráficas de posición y de velocidad (la función y su derivada). Al comenzar el movimiento (cuando la partícula sale disparada hacia arriba) la velocidad es v0. En el tiempo que se alcanza el punto de retorno, el sentido del vector velocidad se invierte y finalmente para un tiempo t2=2v0/g vuelve al punto de partida con una velocidad –v0. Si calculamos la segunda derivada de y(t), o sea, d2y(t)/dt2 obtenemos la derivada de la derivada; dado que es una función lineal, su

pendiente es constante y por ello su derivada es una constante.

Aplicación

Un cuerpo se mueve según la siguiente ecuación de movimiento x(t)=1-e-t. Encontrar, utilizando el teorema de Fermat, los extremos, su velocidad y su aceleración.

Si planteamos dx(t)/dt se obtiene v(t)=e-t y con dv(t)/dt, a(t)= -e-t. Notar que en este caso dx(t)/dt=0 no tiene sentido pues no hay ningún t que satisfaga esa ecuación, por lo tanto, la partícula se seguirá moviendo durante un tiempo infinito y jamás llegará a la posición x=1. En la curva azul, se muestra como la velocidad es cada vez más lenta a medida que pasa el tiempo. Por otro lado,

53

en la curva de color negro se muestra que la aceleración es siempre negativa (aceleración de frena

introduccionalafisica.files.wordpress.com€¦ · 1 | UNIVERSIDAD NACIONAL DE MAR DEL PLATA...

Documents

Transcript of introduccionalafisica.files.wordpress.com€¦ · 1 | UNIVERSIDAD NACIONAL DE MAR DEL PLATA...