capítulo 2. marco teórico - Udlap

hace una distinción entre los términos máquina, mecanismo y cadena ...... Un desplazamiento diferencial de P debido al movimiento angular equivale a la.
990KB Größe 98 Downloads 149 vistas
8

CAPÍTULO 2. MARCO TEÓRICO 2.1. Robótica La robótica es la ciencia o estudio de las tecnologías básicas asociadas con los robots. El estudio incluye tanto la investigación teórica como la aplicada, dividiéndose en el diseño del robot, su mecánica, la planeación y control de trayectoria, su programación e inteligencia artificial [3]. Según la “International Federation of Robotics (IFR)” un robot es una máquina de manipulación automática reprogramable y funcional con tres o más ejes que pueden posicionar y orientar materiales, piezas, herramientas o dispositivos especiales para la ejecución de trabajos diversos en las diferentes etapas de la producción industrial, ya sea en una posición fija o en movimiento [19]. En esta definición la idea clave es la reprogramabilidad, puesto que a diferencia de las máquinas ordinarias que se diseñan con un grado de libertad que permita llevar a cabo todos los movimientos preprogramados mediante un sólo sistema actuador (sea éste un motor), un robot se diseña intencionalmente con más grados de libertad, para así programar el movimiento deseado según las necesidades cambiantes de la industria y permitir con ello una automatización flexible. Los robots pueden ser clasificados de acuerdo a varios criterios: por la tecnología de sus controladores y actuadores (eléctricos, mecánicos o neumáticos), por la estructura cinemática del mecanismo, por la naturaleza de su movimiento o por el número de grados de libertad que posee, entre otros: De acuerdo a la estructura cinemática del mecanismo los robots se dividen en tres grandes categorías: robots seriales, paralelos e híbridos. Se dice que un robot es serial si su cadena cinemática es abierta; es decir, sus elementos se encuentran conectados uno a uno en serie. Un robot paralelo, por el contrario, posee una cadena cinemática cerrada en la cual se pueden identificar varios lazos, como elementos en paralelo de un circuito eléctrico. Si se conectan ambos tipos de cadena cinemática en un robot se dice que éste es híbrido [3].

9

Figura 2.1. Robot serial (izquierda) y robot paralelo (derecha) [12]

En cuanto a la naturaleza de su movimiento los robots pueden clasificarse en planares y espaciales, dependiendo si su movimiento se define sobre planos paralelos o en dos dimensiones, o en el espacio tridimensional. Tanto los robots seriales, paralelos e híbridos pueden ser planares o espaciales [3]. La estructura cinemática del robot junto con la naturaleza de su movimiento y el número de grados de libertad que posee determinan la complejidad del robot, tanto para su análisis como su control, de ahí su importancia. El robot para ser útil debe ser controlado; es decir, debe presentar un comportamiento acorde a una respuesta deseada. Para ello es necesario previamente conocer un modelo matemático del comportamiento del sistema a partir del cual generar las acciones de control requeridas. El modelo matemático del robot implica el análisis del mecanismo: su estructura, geometría y mecánica, así como la obtención de ecuaciones que representen la dinámica del sistema con precisión.

2.2. Teoría básica de mecanismos Un sistema robótico está formado a base de mecanismos y por lo tanto es necesario un previo conocimiento de teoría básica de mecanismos antes de describir las herramientas matemáticas y mecánicas necesarias para su análisis. Como parte de esta teoría básica se hace una distinción entre los términos máquina, mecanismo y cadena cinemática, describiéndose además los elementos que componen a esta última: los eslabones y las articulaciones. Finalmente, se define la movilidad del mecanismo; es decir, la determinación de los grados de libertad.

10

2.2.1. Nociones de máquinas, mecanismos y cadenas cinemáticas Una cadena cinemática es una colección de eslabones y articulaciones conectados [17]:

Figura 2.2. Ejemplo de cadena cinemática [17]

Un eslabón puede ser definido de manera más generalizada como un cuerpo o elemento rígido con dos o más nodos o puntos de unión. Un eslabón puede ser clasificado por el número de nodos que éste contiene; es decir, su grado de conexión. Así, un eslabón binario posee dos nodos, un ternario posee tres, un cuaternario posee cuatro, etc. [17]:

Figura 2.3. Ejemplos de eslabones [20]

Una articulación, también conocida como par cinemático, es una conexión entre dos eslabones mediante sus nodos que permite un movimiento relativo entre ellos [20]. Puede ser clasificada por el número de grados de libertad que permite, el cual es denotado como f, o bien por su orden, es decir, el número de eslabones que conecta [16]. Así mismo, éstas pueden ser actuadas mediante un controlador (o manualmente), denominándose activas, o bien, ser dependientes de la posición y fuerzas del mecanismo, es decir, tratarse de articulaciones pasivas [23]. Las articulaciones elementales poseen un tipo de movimiento o grado de libertad y pueden ser rotacionales (de revolución) o lineales (prismáticas): Una articulación de revolución (R) es como una bisagra ya que permite la rotación relativa entre dos elementos rígidos, y es la más comúnmente empleada. Una articulación prismática (P) permite el movimiento lineal relativo (traslación) entre dos elementos rígidos o eslabones.

11 Las variables de articulación, denotadas por θi para una articulación de revolución y di para una prismática, representan el movimiento relativo entre eslabones adyacentes [6]. Algunos tipos de articulaciones se muestran en la Tabla 2-1: Articulación

Diagrama

Símbolo

Grados de libertad

Revolución (elemental)

R

1

Prismática (elemental)

P

1

Cilíndrica

C

2

Universal

T

2

Esférica

S

3

Planar

E

3

Tabla 2-1. Tipos de articulaciones comunes [21]

Cuando cada eslabón en una cadena cinemática se encuentra conectado a otro cualquiera por al menos dos distintos caminos, la cadena cinemática forma uno o más lazos cerrados y se denomina cadena cinemática cerrada. Por el contrario, si cada eslabón está conectado a otro cualquiera por sólo un camino, la cadena cinemática se denomina cadena cinemática abierta [3]. En una cadena cinemática abierta todas las articulaciones son activas, mientras que en una cadena cinemática cerrada sólo algunas, siendo las restantes pasivas [23]. Cuando una cadena cinemática se forma tanto por cadenas abiertas como cerradas se tiene una cadena cinemática híbrida [3]. Un mecanismo puede definirse como una cadena cinemática que posee un eslabón rígidamente unido a un sistema de referencia, denominado base o tierra [17]. En un mecanismo, uno o más eslabones se asignan como entrada(s). Cuando estos se mueven todos los demás se moverán de acuerdo a las limitantes impuestas por las articulaciones. Así, un mecanismo transmite movimientos, fuerza o torque a través de sus eslabones [3]. Un mecanismo puede ser planar o espacial. En un mecanismo planar el movimiento de los eslabones está restringido a un plano o a planos paralelos. En un mecanismo espacial sus diversos eslabones pueden moverse en diferentes direcciones en el espacio [17].

12 Una máquina es una colección de mecanismos usada en conjunto con otros componentes eléctricos, hidráulicos o neumáticos para transformar energía externa en trabajo útil. Un mecanismo por sí mismo no es una máquina [3]. Así, un robot es una máquina controlada formada por al menos un mecanismo, el cual consiste de eslabones conectados mediante articulaciones en una cadena cinemática soportada por una base (la tierra del mecanismo) [2].

Figura 2.4. Mecanismo de un robot [12]

Uno de los eslabones corresponde al elemento terminal, el cual manipula objetos o realiza tareas de montaje [2]. El objetivo del control es el de posicionar y orientar dicho elemento terminal, pues es éste el encargado de interaccionar directamente con el entorno del robot [12].

2.2.2. Movilidad El número y tipo de articulaciones determina los grados de libertad del mecanismo, abreviados como gdl o DOF del inglés “Degree of Freedom”. Los grados de libertad se relacionan directamente con su movilidad. En la descripción del movimiento de las estructuras, o de los objetos, un grado de libertad es uno de los varios componentes ortogonales que se pueden usar para caracterizar completamente el movimiento. Por ejemplo, un objeto libre en el espacio tiene seis grados de libertad diferentes: Se puede trasladar en tres direcciones mutuamente perpendiculares (posicionamiento) y girar en torno a tres ejes, también perpendiculares (orientación). Cualquier movimiento del objeto, no importa que tan complejo sea, se puede resolver en esos seis movimientos básicos.

13 En cuanto a un mecanismo, un grado de libertad es cada uno de los movimientos básicos (giratorios y de desplazamiento) independientes que una articulación permite efectuar entre dos eslabones de una cadena [12]. Así, el número de grados de libertad de la estructura viene determinado por los grados de libertad de cada una de las articulaciones. Es posible calcular los grados de libertad para un mecanismo mediante síntesis numérica: Primero debe reconocerse que un cuerpo rígido libre en el espacio tiene seis grados de libertad. Deberán conocerse tres desplazamientos lineales y tres rotaciones angulares para determinar su posición en el espacio. De aquí que N cuerpos sin restricciones de movimiento tendrán 6N grados de libertad. Ahora, con el fin de transformar estos cuerpos en un mecanismo, será necesario fijar uno de ellos en tierra y conectarlos por medio de articulaciones. Ambas operaciones reducen el número total de grados de libertad. Al fijar uno de los eslabones se eliminan seis grados de libertad: de aquí que la movilidad se reduzca a 6(N – 1). Además, cada articulación reduce la movilidad en (6 – f), en donde f es el número de grados de libertad de la articulación en particular [14]. De esta forma, con J articulaciones en total, la movilidad M se transforma en: J

J

i =1

i =1

J

J

i =1

i =1

M = 6( N − 1) − ∑ (6 − f i ) = 6(N − 1) − ∑ (6) + ∑ ( f i ) = 6(N − 1) − 6 J + ∑ ( f i ) J

M = 6(N − J − 1) + ∑ ( f i )

(2-1)

i =1

Dicha expresión es válida sin modificación alguna aún cuando varios eslabones sean fijados a tierra y no sólo uno, dado que es posible considerar a todos estos en conjunto como un solo eslabón [16]. En el caso de los mecanismos planares, dicha ecuación debe modificarse para tomar en cuenta el hecho de que un cuerpo rígido tiene tres, no seis, grados de libertad en el movimiento sobre un solo plano [14]: J

M = 3( N − J − 1) + ∑ ( f i )

(2-2)

i =1

Es posible generalizar las dos anteriores ecuaciones al observar que éstas sólo difieren en un coeficiente, el cual vale 6 para la movilidad en el espacio y 3 para la movilidad en un plano. Es decir, que si dicha constante es designada el orden del sistema (λ), entonces:

14 J

M = λ ( N − J − 1) + ∑ ( f i )

(2-3)

i =1

La anterior ecuación es conocida como el criterio de movilidad de Grübler-Kutzback [23], la cual es válida siempre y cuando las limitantes impuestas por las articulaciones sean independientes unas de otras y no involucren redundancias. Cuando un eslabón binario se encuentra conectado en el mecanismo mediante una combinación de articulaciones tales que no sea posible la transmisión de fuerzas o torques y por consecuencia movimiento sobre un eje, entonces se tiene un grado de libertad pasivo. Su existencia también reduce la movilidad del mecanismo y por lo tanto la ecuación (2-3) debe ser modificada: J

M = λ (N − J − 1) + ∑ ( f i ) − f p

(2-4)

i =1

Donde fp en esta ecuación generalizada es el número de grados de libertad pasivos presentes en el mecanismo. En general, los eslabones binarios con articulaciones S-S, S-E y E-E (ver Tabla 2-1) introducen un grado de libertad pasivo [3]. La anterior ecuación permite además interpretar la naturaleza del mecanismo en cuestión a partir los resultados obtenidos: •

Si M > 0 la cadena cinemática posee movilidad, al contrario del caso en que M ≤ 0, en que la cadena cinemática no la posee [23]. Entonces la cadena analizada no es un mecanismo, pero sí una estructura, la cual puede encontrarse forzada (estáticamente indeterminada) para el caso en que M < 0 [17].



Si M < λ, entonces el mecanismo se encuentra limitado, al no poder alcanzar todas las posiciones y orientaciones que el orden del sistema le permite.



Si M = λ se dice que el mecanismo se encuentra determinado, es decir, no está limitado.



Y si M > λ el mecanismo se dice redundante, es decir, puede alcanzar una posición u orientación específica de más de una manera [23], lo cual es particularmente útil en presencia de obstáculos.

15

2.3. Lenguaje Matemático empleado en Robótica La manipulación robótica, por definición, implica que las diferentes partes mecánicas y herramientas se mueven a través del espacio mediante cierto mecanismo, por lo que es necesario poder describir de forma conveniente las posiciones y orientaciones de los objetos en el espacio. Para definir y manipular matemáticamente cantidades que representan posición y orientación es necesario definir sistemas de coordenadas en el espacio tridimensional y establecer ciertas convenciones para su representación [1]. En cuanto a la localización espacial se refiere, es posible hablar de descripciones, operadores y mapeos, los cuales hacen uso de las mismas herramientas matemáticas, pero aplicadas en diferente contexto, o con significado distinto.

2.3.1. Descripciones Una descripción es usada para especificar los atributos de varios objetos con los que se relaciona un sistema de manipulación, siendo estos partes, herramientas o el mismo manipulador [1]. Es posible hablar de descripciones de posiciones, orientaciones y localizaciones en el espacio ó marcos referenciales (también llamados frames):

2.3.1.1. Descripción de una posición Una vez que un sistema de coordenadas es establecido, es posible colocar cualquier punto mediante vectores de posición 3x1, los cuales deberán estar etiquetados, dado que frecuentemente se establecerán varios sistemas de coordenadas en adición al sistema de coordenadas universal, y es preciso designar con respecto a qué sistema están definidos. Para ello se empleará la notación usada por el autor Craig (referencia [1]), que consiste en colocar un superíndice previo al vector, el cual indique el sistema al que pertenece. Por ejemplo, el vector de posición AP pertenece al sistema de coordenadas {A} y sus componentes pueden ser pensados como proyecciones del vector sobre los ejes ortogonales definidos por los vectores unitarios iA, jA y kA (en un sistema de coordenadas cartesiano), donde el subíndice indica que estos definen a dicho sistema de coordenadas.

16 Las componentes escalares del vector se denotan con la misma letra del vector al cual pertenecen más aparte un subíndice que indica el eje correspondiente a cada componente según el sistema de coordenadas indicado: A

[

P = Px

Py

Pz

]

T

(2-5)

De esta forma, la descripción de una posición en el espacio se expresa mediante un vector de posición 3x1 [1]. Para el caso de dos dimensiones se considera que la componente sobre pz es nula, pudiendo considerarse dicho vector como 2x1 [5]. Otra posible forma de expresar las coordenadas de un punto con respecto a un sistema de referencia es mediante el empleo de coordenadas cilíndricas o esféricas.

2.3.1.2. Descripción de una orientación Frecuentemente es necesario no sólo representar un punto en el espacio, sino también describir la orientación de un cuerpo, para lo cual se fija un sistema de coordenadas a éste relativo al sistema de referencia. Una manera de describir dicho sistema de coordenadas {B} fijado al objeto en cuestión, es escribir sus vectores unitarios ortogonales en términos del sistema de referencia {A} [1]: Si iB, jB y kB son los vectores unitarios ortogonales correspondientes al sistema {B}, cuando referidos al sistema {A} se denotan como AiB, AjB y AkB. Si cada vector unitario en {B} se define en términos de {A} se tiene que describir en función de su proyección sobre cada uno de los ejes del sistema de referencia. Así: A

[

i B = i B, x

i B, y

i B, z A

]

T

,

A

[

k B = k B, x

k B, y

[

jB = j B, x

k B, z

]

j B, y

T

j B, z

]

T

,

(2-6)

Si cada uno de estos vectores referidos son colocados como columna en una matriz 3x3 se forma una matriz de rotación, denotada como

A B

R , cuya notación indica que describe un

sistema {B} referido a {A}: A B

R=

[

A

iB

A

jB

A

kB

]

⎡i B , x ⎢ = ⎢i B , y ⎢⎣i B , z

jB,x j B, y j B, z

k B,x ⎤ ⎥ k B, y ⎥ k B , z ⎥⎦

(2-7)

17 De esta forma, la descripción de una orientación en el espacio de un cuerpo se expresa mediante una matriz 3x3 cuyas columnas corresponden a 3 vectores unitarios ortogonales expresados en términos de otro conjunto de 3 vectores de la misma naturaleza cada uno. Esto conlleva a una propiedad muy importante para esta matriz, y es que la inversa de cualquier matriz ortogonal es en sí una matriz ortogonal, la cual también corresponde a su transpuesta, y cuyo determinante vale 1 ó -1: A B

R = AB R −1 = AB R T

Es decir, que si las columnas de

A B

(2-8)

R corresponden a los vectores unitarios de {B}

escritos en términos de {A}, sus renglones representan los vectores unitarios de {A} en términos de {B}. Entonces, una matriz de rotación puede ser interpretada como un conjunto de tres vectores columna, o un conjunto de tres vectores renglón, como se puede apreciar en la ecuación (2-9) [1]. Esto permite fácilmente referir el sistema {B} al {A} o el {A} al {B}. A B

R=

[

A

iB

A

jB

A

kB

]

⎡ B i TA ⎤ ⎢ ⎥ = ⎢ B j TA ⎥ ⎢ B k TA ⎥ ⎣ ⎦

(2-9)

Para el caso bidimensional se consideran AiB y AjB, resultando en una matriz 2x2.

2.3.1.3. Descripción de una localización o marco referencial Si se unen las descripciones anteriores en una sola para describir la manera en que está colocado un objeto en el espacio respecto a un sistema de coordenadas de referencia {A}, teniendo dicho objeto un subsistema de coordenadas asociado a él {B}, es posible realizar dicha descripción a partir de la posición del origen de dicho sistema con respecto a {A} (traslación), es decir, APBorg y su respectiva orientación ( AB R ) con el sistema de referencia (rotación), es decir, que ésta puede determinarse a partir de 4 vectores de tres elementos cada uno (3 para la rotación y 1 para la traslación):

{B} = {AB R, A PBorg }

(2-10)

18 Un cambio en la posición con orientación constante puede representarse mediante la matriz de rotación unidad y un vector con los cambios en las coordenadas del punto, así como un cambio en la orientación manteniendo constante la posición puede representarse como un vector de posición de magnitud cero y una matriz de rotación determinada [5]. Una representación gráfica de los marcos referenciales conveniente para su visualización consiste en tres flechas representando los tres vectores unitarios ortogonales definiendo los principales ejes de dicho marco referencial, las cuales parten de un origen. Así mismo, una flecha representando a un vector de posición es dibujada desde el origen de un marco referencial al origen de otro. El sentido de dicho vector indica que un marco referencial {B} (apuntado por dicho vector), por ejemplo, es relativo a {A} (del cual parte el vector), y no viceversa, tal y como se ejemplifica en la figura Figura 2.5:

Figura 2.5. Varios marcos referenciales relativos entre ellos [1]

Es decir, que un marco referencial (llamado frame de ahora en adelante) puede ser usado como un sistema de coordenadas relativo a otro, representando así una generalización de la descripción de la posición y la orientación [1].

2.3.2. Mapeos Al resolver problemas de robótica, generalmente se expresa la misma cantidad en términos de varios sistemas de coordenadas de referencia, es decir, se realiza un mapeo de manera que se cambie la descripción de un frame hecha con respecto a una referencia en otra descripción hecha con respecto a otra referencia, de tal manera que sólo cambie la descripción y no su posición u orientación en sí.

19 Para ello se ocupan las mismas herramientas matemáticas usadas para describir los frames, y se consideran tres casos en los una posición BP expresada en un frame {B} debe ser referida respecto a un frame {A}: 1. Cuando el frame {B} sólo se encuentra trasladado y mantiene la misma orientación que el {A} es posible hacer uso de la descripción de posición del origen de {B} dada por APBorg: A

P = B P + A PBorg

(2-11)

2. Cuando el origen de ambos frames coincide y sólo cambia la orientación es posible hacer uso de la descripción de orientación de {B} respecto a {A} dada por A

A B

R:

P = AB R B P

(2-12)

3. Cuando ni el origen de ambos frames coincide ni tampoco su orientación, entonces se usan tanto la descripción de posición como de orientación en conjunto [1]: A

P = AB R B P + A PBorg

(2-13)

2.3.2.1. Transformaciones Homogéneas La ecuación (2-13) permite transformar la descripción de un vector de posición especificada en un frame a otro; sin embargo, es posible expresar la transformación anterior usando solamente una matriz de transformación, denominada como homogénea. Para ello es necesario introducir el concepto de coordenadas homogéneas las cuales se representan en un espacio de cuatro dimensiones, como se puede observar en la ecuación (2-14): A

[

P = ρPx

ρPy

ρPz

ρ ]T

(2-14)

La cuarta coordenada no puede ser cero y se denomina factor de escalamiento, el cual para aplicaciones de robótica tiende a ser unitario por conveniencia. La matriz de transformación homogénea es una matriz 4x4 definida como a continuación se muestra:

20 ⎡ AB R → (3 x3) M ⎢ A L M BT = ⎢ ⎢ γ → (1x3) M ⎣

A

PBorg → (3 x1)⎤ ⎥ L ⎥ ρ → (1x1) ⎥⎦

(2-15)

En dicha matriz se puede observar que también se encuentra presente el factor de escalamiento ya antes mencionado y otra submatriz denominada como γ, la cual corresponde a la transformación de perspectiva y que en aplicaciones de robótica usualmente es nula: ⎡ AB R M ⎢ A L M BT = ⎢ ⎢0 0 0 M ⎣

A

PBorg ⎤ ⎥ L ⎥ 1 ⎥⎦

(2-16)

Un aspecto que es necesario mencionar de esta matriz es que no es ortogonal, y por ello su inversa no se obtiene de manera tan directa como en la matriz de rotación: ⎡ AB R T M − AB R T A PBorg ⎤ ⎢ ⎥ −1 B A L M L B T = AT = ⎢ ⎥ ⎢0 0 0 M ⎥ 1 ⎣ ⎦

(2-17)

Así, la ecuación (2-13) puede ser escrita en forma compacta de la siguiente manera, tomando en cuenta que tanto

A

P como

B

P deben ser expresados en coordenadas

homogéneas [3]: A

P = AB T B P

(2-18)

2.3.3. Operadores Las herramientas matemáticas anteriormente descritas pueden ser usadas para describir la localización en el espacio de un objeto en varios sistemas de referencia o bien para transformar dicha localización en un sistema de referencia, dependiendo de la interpretación dada. Así, es posible tener operadores de traslación, de rotación y de localización: 1. Un operador de traslación mueve un punto en el espacio trasladándolo en la dirección de un vector. Es posible definir dicho operador mediante una matriz de transformación homogénea.

21 2. Un operador de rotación mueve un punto en el espacio mediante una rotación alrededor de un determinado eje, siendo los argumentos la dirección del eje y el ángulo. El operador puede definirse ya sea mediante una matriz de transformación homogénea o una de rotación. A

P2 = R K,θ A P1

(2-19)

3. Un operador de localización considera tanto traslación como rotación para modificar la localización de un objeto en el espacio y se define mediante una matriz de transformación homogénea [1].

2.3.4. La orientación en el espacio Cuando se requiere describir una orientación cualquiera especificar la matriz de rotación de manera directa no es conveniente. Ésta contiene nueve parámetros, pero dado que la rotación en el espacio es un movimiento de tres grados de libertad, sólo tres parámetros independientes deben ser suficientes para especificar cualquier orientación [3]. El teorema de Euler establece que cualquier rotación o conjunto de rotaciones sucesivas para alcanzar una orientación específica puede expresarse siempre como una rotación alrededor de un único eje principal. Si el conjunto de rotaciones componentes usadas son finitas, es importante mantener el orden en que se aplican. Esto es porque las rotaciones finitas no obedecen la ley de la suma vectorial, y por ello no pueden ser clasificadas como cantidades vectoriales, al contrario de las rotaciones infinitesimalmente pequeñas que sí pueden ser clasificadas como vectores [8]. Así, es posible especificar una determinada orientación mediante varias rotaciones sucesivas, empleando matrices de rotación que se multiplican para formar una matriz de rotación compuesta. Sin embargo, al tratarse de rotaciones finitas el orden sí importa y es necesario seguir dos reglas básicas: 1. Rotaciones siempre realizadas respecto a un frame fijo resultan en una premultiplicación de matrices. 2. Rotaciones respecto al frame actual, ya rotado, resultan en una postmultiplicación de matrices [3].

22 Teniendo en mente estas reglas se describen algunas representaciones útiles para especificar una determinada orientación: 1. Ángulos RPY o Balanceo (Roll), Inclinación (Pitch) y Desviación (Yaw). Siendo el objeto orientado de manera que apunte hacia el eje X se define su orientación respecto a un sistema coordenado fijo con un claro significado físico. Primero se balancea mediante una rotación sobre el eje X con un ángulo γ, luego se inclina mediante una rotación sobre el eje Y con un ángulo β y finalmente se desvía mediante una rotación sobre el eje Z con un ángulo α. A B

R rpy (γ , β , α ) = R Z,α ⋅ R Y,β ⋅ R X,γ

(2-20)

2. Ángulos Euler Z-Y-X. Se basan en rotaciones respecto al sistema coordenado previamente rotado girando sobre Z, Y y X los ángulos α, β y γ respectivamente. A B

R zyx (α , β , γ ) = R Z,α ⋅ R Y,β ⋅ R X,γ

(2-21)

En este caso la matriz de rotación resultante resulta ser idéntica a la anteriormente obtenida, sin embargo la interpretación es diferente. 3. Ángulos Euler Z-Y-Z. Se basan también en rotaciones respecto al sistema coordenado previamente rotado pero girando sobre Z, Y y Z los ángulos α, β y γ respectivamente [1]. A B

R zyz (α , β , γ ) = R Z,α ⋅ R Y,β ⋅ R Z,γ

(2-22)

Aunque las anteriores representaciones son útiles en muchos casos, a veces es más conveniente efectuar rotaciones sobre un eje arbitrario. Una manera de derivar la matriz de rotación para este último caso es rotar el vector unitario que defina el eje arbitrario hasta coincidir con uno de los ejes de referencia, por ejemplo Z. Para ello se rota primero un ángulo -α sobre Z y luego un ángulo -β sobre Y. Hecho esto se rota sobre Z el ángulo deseado θ para luego devolver el vector unitario a su orientación original (Figura 2.6) [6]. A B

R k,θ (α , β , θ ) = R Z,α ⋅ R Y,β ⋅ R Z,θ ⋅ R Y, −β ⋅ R Z, −α

(2-23)

23

Figura 2.6. Rotación alrededor de un eje arbitrario [6]

2.3.5. Transformaciones compuestas Se suponen tres frames: {A}, {B} y {C}. El frame {C} es relativo al {B} y {B} lo es al {A}. Un vector CP puede describirse en términos de {A} mediante transformaciones compuestas: A

P = ABT BCT C P

(2-24)

De ahí que es posible obtener la descripción directa de {C} relativo a {A} mediante: A C

T= ABT BCT

(2-25)

Esta idea puede extenderse para introducir el concepto de ecuaciones de transformación. En la Figura 2.7 es posible expresar el frame {D} relativo a {U} con una ecuación de transformación, y como tal puede manipularse para encontrar alguna transformación no conocida: D U

T = UAT AD T = UBT BC T CD T

(2-26)

T = UBT −1 UAT AD T CD T −1

(2-27)

B C

Figura 2.7. Escenario típico para aplicar ecuaciones de transformación

24

2.4. Mecánica de los robots La mecánica es la rama de la física que se ocupa del estado de reposo o movimiento de cuerpos sometidos a la acción de fuerzas. La mecánica vectorial de cuerpos rígidos se divide en dos áreas: estática y dinámica. La estática tiene que ver con el equilibrio de un cuerpo que permanece en reposo o que se mueve con velocidad constante. La dinámica se ocupa del movimiento acelerado de un cuerpo y se divide en dos partes: cinemática y cinética [8]: •

La cinemática se ocupa de los aspectos geométricos y temporales del movimiento sin atender a las fuerzas y/o torques que lo producen. Entre dichos aspectos se encuentran la posición, velocidad y aceleración. En un robot las variables de las articulaciones están relacionadas con la posición y orientación del elemento terminal mediante las limitantes impuestas por ellas mismas. Estas relaciones cinemáticas son el principal interés en el estudio de la cinemática de los robots.



La cinética se ocupa de las fuerzas y/o torques requeridos para causar el movimiento de un sistema de cuerpos. En un robot el elemento terminal debe ser guiado a través de una determinada trayectoria tomando en cuenta ciertas características de movimiento deseadas. Un conjunto de funciones de fuerza y/o torque deben ser aplicadas en las articulaciones activas para producir tal movimiento. Sin embargo, estas relaciones no sólo dependen de atributos espaciales y temporales, sino también de la masa e inercia de los eslabones, la carga soportada por el robot y otras fuerzas externas, como por ejemplo la fricción [3].

Así, en robótica la mecánica es empleada como herramienta para obtener el modelo matemático de un sistema en forma de ecuaciones que permitan controlarlo. Sin embargo, según la terminología manejada en dicho ámbito el término dinámica corresponde al concepto denotado como cinética en la mecánica vectorial, según [7] y [8] . De esta forma, el modelo de un sistema considera tanto su cinemática como su dinámica, por lo que de ahora en adelante en este trabajo de tesis se adoptará dicha terminología. En las secciones siguientes se revisa la teoría correspondiente tanto a cinemática como a dinámica, así como la manera en que se aplican los conceptos resultantes en el ámbito de la robótica.

25

2.5. Fundamentos de cinemática Para entender la teoría correspondiente es necesario primero analizar la cinemática plana de un cuerpo rígido y luego extender el análisis para el caso de tres dimensiones.

2.5.1. Cinemática plana de un cuerpo rígido Cuando todas las partículas de un cuerpo rígido se mueven a lo largo de trayectorias que son equidistantes de un plano fijo, se dice que el cuerpo experimenta movimiento plano. Hay tres tipos de movimiento plano: 1. Traslación. Este tipo de movimiento ocurre si cada segmento de línea sobre un cuerpo rígido permanece paralelo a su dirección original durante el movimiento. Cuando las trayectorias de movimiento para dos partículas cualesquiera del cuerpo son a lo largo de líneas rectas equidistantes, el movimiento se llama traslación rectilínea. Sin embargo, si las trayectorias de movimiento pasan por líneas curvas que son equidistantes, el movimiento se llama traslación curvilínea.

Figura 2.8. Traslación rectilínea (a la izquierda) y traslación curvilínea (a la derecha)

2. Rotación con respecto a un eje fijo. Cuando un cuerpo rígido gira con respecto a un eje fijo, todas las partículas del cuerpo, excepto aquellas que se encuentran sobre el eje de rotación, se mueven por trayectorias circulares.

Figura 2.9. Rotación respecto a un eje fijo

3. Movimiento plano general. Ocurre cuando un cuerpo rígido experimenta una combinación de traslación y rotación. La traslación ocurre dentro de un plano de referencia, y la rotación se efectúa con respecto a un eje perpendicular a él [8].

26

Figura 2.10. Movimiento plano general

Si varios cuerpos rígidos o eslabones se conectan para formar un mecanismo planar existirá un movimiento relativo entre ellos, mereciendo éste un especial interés cuando un análisis de movimiento plano general de cada cuerpo rígido en forma aislada no es suficiente para describir el movimiento.

2.5.1.1. Traslación Se considera un cuerpo que está sometido a un movimiento de traslación rectilínea o curvilínea. Unido al cuerpo se encuentra un sistema coordenado que se traslada con éste y tiene su origen en el punto C denominado punto base, como se observa en la Figura 2.11:

Figura 2.11. Movimiento de traslación de un cuerpo rígido

La posición del punto C y otro punto P cualquiera sobre el cuerpo se define desde un marco de referencia fijo mediante vectores de posición rC y rP. Además, se define un vector de posición relativa rP/C, el cual ubica a “P con respecto a C”. Así: rP = rC + rP/C

(2-28)

La razón de cambio con respecto al tiempo de rP representa la velocidad del punto P: vP =

drP drC drP/C = + dt dt dt

(2-29)

27 Sin embargo, si se considera un cuerpo rígido, el vector rP/C no cambia respecto al sistema coordenado en traslación, por lo que su razón de cambio es cero: vP =

drC dt

vP = vC

(2-30)

Tomando de nuevo la razón de cambio con respecto al tiempo de la anterior ecuación se obtiene una relación similar para la aceleración: dv P dv C = dt dt

aP = aC

(2-31)

Las dos ecuaciones anteriores indican que todos los puntos en un cuerpo rígido sometido a traslación rectilínea o curvilínea se mueven con la misma velocidad y aceleración. Es por ello que para este caso basta con analizar un punto sobre el cuerpo, por ejemplo su centro de masa, para describir su movimiento [8].

2.5.1.2. Rotación con respecto a un eje fijo Cuando un cuerpo está girando alrededor de un eje fijo, cualquier punto P ubicado en el cuerpo viaja por una trayectoria circular. Para estudiar este movimiento es necesario primero analizar el movimiento angular del cuerpo alrededor del eje:

Figura 2.12. Movimiento angular de un cuerpo en rotación con respecto a un eje fijo

28 Con referencia a la Figura 2.12 en el instante mostrado la posición angular de r está definida por el ángulo θ, medido entre una línea de referencia fija y r. El cambio en la posición angular, que puede ser medido como un diferencial dθ (las rotaciones infinitesimales sí pueden considerarse vectores, ver sección 2.3.4), se llama desplazamiento angular. Dado que el movimiento se realiza con respecto a un eje fijo, la dirección de dθ coincide con el eje de rotación, siendo su sentido determinado con la regla de la mano derecha. La razón de cambio con respecto al tiempo de la posición angular se llama velocidad angular ω, mientras que la razón de cambio con respecto al tiempo de dicha velocidad angular se llama aceleración angular α: ω=

dθ , dt

α=

dω dt

(2-32)

Una vez analizado el movimiento angular del cuerpo rígido es posible analizar el movimiento de cualquier punto P [8].

Figura 2.13. Velocidad de P sobre un cuerpo rígido en rotación respecto a un eje fijo

La posición de P está definida por el vector de posición r, el cual se extiende desde el eje de rotación de manera perpendicular hasta P o por rP, el cual va desde cualquier punto del eje de rotación hasta P. La longitud de un arco s se obtiene mediante el producto del radio de rotación por el incremento angular: s = r∆θ

(2-33)

29 Un desplazamiento diferencial de P debido al movimiento angular equivale a la longitud de arco recorrida para un desplazamiento angular diferencial de magnitud dθ. El radio de rotación de P está definido por el vector de posición r, el cual es perpendicular al eje de rotación. Si se define un vector rP que vaya desde cualquier punto del eje de rotación hasta P (Figura 2.13), entonces r corresponderá a la proyección de rP sobre la perpendicular al eje de rotación. Así, si el ángulo entre el eje de rotación y rP es φ, la magnitud r estará relacionada con la magnitud rP mediante la siguiente relación: r = rP sin φ

(2-34)

Entonces, para un desplazamiento diferencial ds correspondiente a P: ds = (rP sin φ )dθ

(2-35)

La razón de cambio con respecto al tiempo del anterior desplazamiento diferencial corresponde a la velocidad del punto P: vP =

ds dθ = (rP sin φ ) = (rP sin φ )ω = (ω )(rP )sin φ dt dt

(2-36)

La ecuación (2-36) especifica la magnitud de vP, vector cuya dirección es tangencial a la trayectoria circular en todo momento y cuyo sentido concuerda con el de la rotación. Esta ecuación puede ser escrita en forma vectorial recordando la definición de producto cruz y tomando en cuenta el sentido que debe tener vP: v P = ω × rP

(2-37)

La razón de cambio con respecto al tiempo de la velocidad de P corresponde a la aceleración de este punto: aP =

dv P dω dr = × rP + ω × P dt dt dt

(2-38)

Recordando que la flecha del vector rP coincide en todo momento con P, la razón de cambio con respecto al tiempo de este punto es la misma que la del vector. Así: vP =

drP dt

(2-39)

30 Entonces, la ecuación (2-38) queda expresada de la siguiente manera: a P = α × rP + ω × v P a P = α × rP + ω × (ω × rP )

(2-40)

La ecuación (2-40) se encuentra formada por dos términos o componentes (Figura 2.14). El primero corresponde a la componente tangencial de la aceleración a tP y representa la razón de cambio con respecto al tiempo de la magnitud de la velocidad. Si la rapidez de P aumenta, entonces esta componente actúa en la misma dirección que v. El segundo término corresponde a la componente normal de la aceleración a nP y representa la razón de cambio con respecto al tiempo de la dirección de la velocidad. La dirección de este vector siempre se dirige hacia O, el centro de la trayectoria circular [8]. Es decir: a P = a tP + a nP

(2-41)

Figura 2.14. Aceleración de P sobre un cuerpo rígido en rotación respecto a un eje fijo

2.5.1.3. Movimiento plano general El movimiento plano general de un cuerpo rígido puede ser descrito como una combinación de traslación y rotación. Se considera que un sistema coordenado se traslada junto con el cuerpo pero no gira con él, tal y como se observa en la Figura 2.15. Este sistema coordenado tiene su origen en el punto base A, el cual tiene un movimiento conocido [8]:

31

Figura 2.15. Movimiento plano general de un cuerpo rígido

El vector de posición rA ubica el punto base A desde un marco de referencia fijo y el vector de posición relativa rB/A sitúa el punto B con respecto al punto A. Así, para B: rB = rA + rB / A

(2-42)

Para determinar la relación entre las velocidades de los puntos A y B es necesario derivar la ecuación de posición anterior con respecto al tiempo: drB drA drB / A = + dt dt dt

vB = vA + vB/ A

(2-43)

El término vA corresponde a la velocidad absoluta del punto base A, generalmente conocida y producida por la traslación del cuerpo rígido. El término vB/A corresponde a la velocidad relativa de “B con respecto a A”, producida por la rotación de dicho cuerpo con velocidad angular ω. Así, recordando la ecuación (2-37): v B / A = ω × rB / A

(2-44)

Este término se sustituye en la ecuación (2-43) para encontrar la relación buscada: v B = v A + ω × rB / A

(2-45)

Para relacionar las aceleraciones de dos puntos sobre un cuerpo rígido sometido a movimiento plano general se deriva la ecuación (2-43) con respecto al tiempo: dv B dv A dv B / A = + dt dt dt

aB = a A + aB / A

(2-46)

32 El término aA corresponde a la aceleración absoluta del punto base A por traslación. El término aB/A corresponde a la aceleración relativa de “B con respecto a A” por rotación con velocidad angular ω y aceleración angular α. Así, recordando la ecuación (2-40): a B / A = α × rB / A + ω × (ω × rB / A )

(2-47)

Este término se sustituye en la ecuación (2-46) para encontrar la relación buscada: a B = a A + α × rB / A + ω × (ω × rB / A )

(2-48)

Esta aceleración relativa consta de dos componentes: uno tangencial y uno normal, de tal forma que la ecuación (2-46) puede ser reescrita como: a B = a A + a tB / A + a nB / A

(2-49)

2.5.1.4. Movimiento relativo Cuando se analizan mecanismos planares el movimiento de los eslabones es de traslación (rectilínea o curvilínea), rotación con respecto a un eje fijo o movimiento plano general, siendo posible analizar cada eslabón por separado si es que no existe deslizamiento en las conexiones (Figura 2.16).

Figura 2.16. Movimientos en un mecanismo planar cuando no existe deslizamiento en las conexiones [8]

Un análisis más general considera que se presenta dicho deslizamiento siendo necesario en ese caso no sólo analizar el movimiento de un punto sobre un cuerpo rígido, sino dos puntos coincidentes que se encuentran en un mecanismo pero no están sobre el mismo cuerpo (Figura 2.17).

33

Figura 2.17. Mecanismo en el cual existe deslizamiento en las conexiones [8]

Se considera un cuerpo rígido en movimiento plano general. Unido a éste se encuentra un sistema coordenado que se traslada y rota junto con él y tiene su origen en el punto base A. Otro cuerpo se encuentra conectado a él mediante una conexión que se desliza, siendo B el punto común donde coinciden el cuerpo rígido y la conexión, tal y como se observa en la Figura 2.18 [8]:

Figura 2.18. Movimiento relativo entre dos cuerpos rígidos

Al igual que para el movimiento plano general: rB = rA + rB / A

(2-50)

La velocidad del punto B se determina tomando la derivada con respecto al tiempo de la ecuación (2-50): drB drA drB / A = + dt dt dt drB / A vB = vA + dt

(2-51)

34 El último término de la ecuación (2-51) representa la razón de cambio con respecto al tiempo del vector de posición relativa de “B con respecto a A” vista desde el marco de referencia fijo. Este vector presenta movimiento debido a la rotación del cuerpo en movimiento plano general y al deslizamiento ocurrido en la conexión. Así, si se evalúa este término por separado:

drB / A dt

drB / A d = (rB / A, x i A + rB / A, y j A ) dt dt drB / A, y ⎞ di dj ⎞ ⎛ drB / A, x ⎛ iA + j A ⎟⎟ = ⎜ rB / A, x A + rB / A, y A ⎟ + ⎜⎜ dt dt ⎠ ⎝ dt dt ⎝ ⎠

(2-52)

Los dos términos dentro del segundo paréntesis de la ecuación (2-52) representan la velocidad relativa vB,rel del punto B con respecto al sistema coordenado unido al cuerpo rígido. Los dos términos dentro del primer paréntesis representan la razón instantánea de cambio con respecto al tiempo de los vectores unitarios iA y jA con respecto al marco de referencia fijo. Estos vectores se encuentran en rotación, por lo que recordando las ecuaciones (2-37) y (2-39), estos se pueden expresar como: di A = ω× iA , dt

dj A = ω × jA dt

(2-53)

Así, tomando en cuenta estos resultados la ecuación (2-52) puede ser expresada de la siguiente manera: drB / A = (rB / A, x ω × i A + rB / A, y ω × j A ) + v B,rel dt drB / A = ω × (rB / A, x i A + rB / A, y j A ) + v B,rel dt drB / A = ω × rB / A + v B,rel dt

(2-54)

Sustituyendo en la ecuación (2-51) se obtiene la relación de velocidad buscada: v B = v A + ω × rB / A + v B,rel

(2-55)

Esta velocidad consta de tres componentes: el primero de ellos representa la traslación del cuerpo rígido en movimiento plano general, el segundo la respectiva rotación y el tercero la velocidad relativa del punto B con respecto a este cuerpo.

35 O visto de otra forma, los dos primeros términos representan la velocidad del punto B por parte del movimiento plano general como si B se fijara al cuerpo rígido (velocidad de transporte vB,tr del punto B), mientras que el último término representa la velocidad relativa vB,rel del punto B por parte del deslizamiento de la conexión. Así: v B = v B,trans + v B,rel

(2-56)

Para obtener una expresión similar para la aceleración se deriva la ecuación (2-55) con respecto al tiempo: dv B dv A d (ω × rB / A ) dv B,rel = + + dt dt dt dt d (ω × rB / A ) dv B,rel aB = aA + + dt dt

(2-57)

El penúltimo término de la ecuación (2-57) puede ser evaluado recordando el resultado obtenido en la ecuación (2-54): d (ω × rB / A ) dω dr = × rB / A + ω × B / A dt dt dt d (ω × rB / A ) = α × rB / A + ω × (ω × rB / A + v B,rel ) dt d (ω × rB / A ) = α × rB / A + ω × (ω × rB / A ) + ω × v B,rel dt

(2-58)

De igual forma también se evalúa el último término de la misma ecuación: dv B,rel

dv B,rel dt

⎛ = ⎜ v B ,rel , x ⎝

d (v B,rel , x i A + v B,rel , y jA ) dt dt dv B ,rel , y ⎞ di A dj ⎞ ⎛ dv B ,rel , x iA + j A ⎟⎟ + v B ,rel , y A ⎟ + ⎜⎜ dt dt ⎠ ⎝ dt dt ⎠ =

(2-59)

Los dos términos dentro del segundo paréntesis de la ecuación (2-59) representan la aceleración relativa aB,rel del punto B con respecto al sistema coordenado unido al cuerpo en movimiento plano general. Los dos términos dentro del primer paréntesis pueden evaluarse recordando las expresiones de la ecuación (2-53), de tal manera que al sustituir en la ecuación (2-59):

36 dv B,rel

= (v B ,rel , x ω × i A + v B ,rel , y ω × j A ) + a B,rel dt dv B,rel = ω × (v B , rel , x i A + v B ,rel , y j A ) + a B,rel dt dv B,rel = ω × v B,rel + a B,rel dt

(2-60)

Sustituyendo las ecuaciones (2-58) y (2-60) en la (2-57) se obtiene la relación buscada: a B = a A + (α × rB / A + ω × (ω × rB / A ) + ω × v B,rel ) + (ω × v B,rel + a B,rel )

a B = a A + α × rB / A + ω × (ω × rB / A ) + a B,rel + 2ω × v B,rel

(2-61)

Esta aceleración consta de cinco componentes: el primero de ellos representa la traslación del cuerpo rígido en movimiento plano general, los dos siguientes la respectiva rotación pues corresponden a las respectivas componentes tangencial y normal, el cuarto representa la aceleración relativa del punto B con respecto a este cuerpo y el quinto corresponde a la aceleración de Coriolis, la cual aparece cuando se presentan marcos de referencia rotatorios. O visto de otra forma, los tres primeros términos representan la aceleración del punto B por parte del movimiento plano general como si B se fijara al cuerpo rígido (aceleración de transporte aB,tr del punto B), mientras que los dos últimos términos representan la aceleración relativa aB,rel del punto B por parte del deslizamiento de la conexión y la aceleración de coriolis aB,c del mismo punto, respectivamente. Así: a B = a B,trans + a B,rel + a B,c

(2-62)

2.5.2. Cinemática tridimensional de un cuerpo rígido El análisis de un cuerpo rígido sometido a movimiento plano puede extenderse al caso en que se presenta movimiento tridimensional, en el cual de manera semejante existen tres tipos de movimiento: traslación, rotación con respecto a un punto fijo y movimiento general. El primero se puede extender del caso planar sin consideraciones adicionales, no así los otros dos. Así mismo, si varios cuerpos rígidos se conectan para formar un mecanismo espacial, también se podrá aplicar un análisis de movimiento relativo.

37

2.5.2.1. Rotación con respecto a un punto fijo Cuando un cuerpo rígido gira con respecto a un punto fijo O, la distancia r desde dicho punto hasta otro cualquiera P es la misma para cualquier posición del cuerpo; es decir, su trayectoria de movimiento se encuentra sobre la superficie de una esfera de radio r [8]. Aquí es necesario distinguir entre rotaciones finitas e infinitesimales. Las primeras ocurren si el cuerpo rígido rota sobre varios ejes, uno a uno, mientras que las segundas se dan cuando la rotación sobre estos se realiza de manera simultánea. Tal como se mencionó en la sección 2.3.4, las rotaciones finitas no pueden ser clasificadas como vectores pues no obedecen la ley conmutativa de la suma, mientras que las infinitesimales sí lo hacen, pudiendo así definirse un eje instantáneo de rotación alrededor del cual el cuerpo parezca girar en un determinado momento, pues cambiará de dirección constantemente. Así, la velocidad angular Ω del cuerpo se define por la razón de cambio del desplazamiento angular con respecto al tiempo, siendo el vector resultante colineal con el eje instantáneo de rotación. La aceleración angular ε se determina a partir de la derivada con respecto al tiempo de dicha velocidad angular, pero su vector no es colineal con el de la velocidad angular, pues representa tanto el cambio de magnitud como de dirección de la velocidad angular [8]. Entonces: Ω=

dθ , dt

ε=

dΩ dt

(2-63)

Extendiendo los resultados obtenidos para el caso planar a partir de las ecuaciones (2-37), (2-40) y (2-41) [8]: vP = Ω× r

(2-64)

a P = a tP + a nP = ε × r + Ω × (Ω × r )

(2-65)

2.5.2.2. Movimiento general El movimiento general de un cuerpo rígido puede ser descrito como una combinación de traslación y rotación, pero en tres dimensiones. Extendiendo los resultados obtenidos para el caso planar a partir de las ecuaciones (2-42), (2-43), (2-45), (2-48) y (2-49) [8]:

38 rB = rA + rB / A

(2-66)

v B = v A + v B / A = v A + Ω × rB / A

(2-67)

a B = a A + a tB / A + a nB / A = a A + ε × rB / A + Ω × (Ω × rB / A )

(2-68)

2.5.2.3. Movimiento relativo Cuando se analizan mecanismos espaciales surgen situaciones similares a las del movimiento planar, requiriéndose también un análisis más general que considere deslizamiento en las conexiones. Extendiendo los resultados obtenidos para el caso planar a partir de las ecuaciones (2-50), (2-55), (2-56), (2-61) y (2-62) [8]: rB = rA + rB / A

(2-69)

v B = v A + Ω × rB / A + v B,rel = v B,trans + v B,rel

(2-70)

a B = a A + ε × rB / A + Ω × (Ω × rB / A ) + a B,rel + 2Ω × v B,rel = a B,trans + a B,rel + a B,c

(2-71)

2.6. Cinemática aplicada al ámbito de la robótica En robótica los cuerpos estudiados son precisamente los robots siendo la cinemática empleada para analizar su movimiento con respecto a un sistema de referencia, específicamente las relaciones entre las variables de localización de su elemento terminal y el valor de las variables articulares activas [19]. El análisis cinemático entonces considera tanto las relaciones de posicionamiento y orientación como las de velocidad y aceleración.

2.6.1. Análisis de posicionamiento y orientación Como parte de este análisis se describen a continuación los denominados problemas cinemáticos inverso y directo, así como las estrategias más populares empleadas en la resolución de estos problemas. Finalmente, se define el concepto de espacio de trabajo a partir de las limitantes geométricas y mecánicas del mecanismo.

39

2.6.1.1. Problemas cinemáticos inverso y directo El análisis de posicionamiento y orientación busca tener conocimiento en todo momento de la localización del elemento terminal del robot y puede tratarse en dos sentidos opuestos, separándose en los problemas cinemáticos inverso y directo: •

El problema cinemático inverso consiste en determinar la configuración que debe adoptar el robot (el valor de sus variables articulares activas) dadas una posición y orientación del elemento terminal determinadas.



El problema cinemático directo consiste en determinar la posición y orientación del elemento terminal del robot, con respecto a un sistema de coordenadas de referencia, conocidas las variables articulares activas y la geometría del robot [19].

2.6.1.2. Estrategias de resolución Ambos tipos de problemas pueden ser resueltos mediante varias estrategias, siendo las más populares la representación de Denavit-Hartenberg (D-H) y la solución geométrica [1]: La representación de Denavit-Hartenberg representa un método sistemático para la colocación de frames en cada eslabón del robot de tal forma que la matriz de transformación homogénea entre ellos dependa de cuatro parámetros (ai, αi, di, θi) o sea el producto de cuatro transformaciones básicas: El frame correspondiente al eslabón i se coloca de la siguiente forma (ver Figura 2.19): el eje zi coincide con el eje de la articulación i+1 que conecta con el eslabón i+1, el eje xi se tiende colineal a la línea más corta que conecte los ejes zi-1 y zi cuando no son coplanares, o con origen sobre la articulación i+1 cuando ambos ejes sí lo son. El eje yi se determina con la regla de la mano derecha. Los cuatro parámetros se definen de la siguiente manera: 1. El parámetro ai corresponde a la distancia de traslación a lo largo del eje xi desde el eje zi-1 hasta el origen del sistema i-ésimo. Representa la longitud del eslabón. 2. El parámetro αi corresponde al ángulo de rotación sobre el eje xi; es decir, el ángulo existente entre los ejes zi-1 y zi. Representa la torsión del eslabón. 3. El parámetro di corresponde a la distancia de traslación a lo largo del eje zi-1 desde el origen del sistema de coordenadas (i-1)-ésimo hasta el eje xi. Se trata de la variable articular para la articulación i si ésta es prismática.

40 4. El parámetro θi corresponde al ángulo de rotación sobre el eje zi-1; es decir, el ángulo existente entre los ejes xi-1 y xi. Se trata de la variable articular para la articulación i si ésta es rotacional [6].

Figura 2.19. Convención de parámetros para la representación D-H [19]

Así, la matriz de transformación correspondiente queda definida como [19]: i −1

A i = T(z, θ i ) ⋅ T(0,0, d i ) ⋅ T(ai ,0,0) ⋅ T( x, α i )

(2-72)

El enfoque geométrico se basa en la descomposición de la geometría espacial del robot en varios problemas geométricos planos, para los cuales se usan herramientas geométricas y trigonométricas para encontrar el valor de las variables articulares o la posición y orientación del elemento terminal. En lo que se respecta a los robots seriales el problema cinemático directo comúnmente se resuelve de manera sistemática mediante la representación D-H; sin embargo, dada la existencia de múltiples soluciones al resolver el problema cinemático inverso, un enfoque geométrico es más sencillo de aplicar en dicho caso [1]. Para los robots paralelos la existencia de varios lazos cerrados dificultaría la aplicación de la representación D-H. Además, la existencia de articulaciones con más de un gdl (las articulaciones esféricas como caso típico) imposibilita usar esta representación tal y como está definida, pues más de cuatro parámetros por eslabón serían necesarios para definir completamente una determinada configuración del robot. Es por ello que para este tipo de robots se prefiere el enfoque geométrico, definiéndose ecuaciones vectoriales para cada brazo en donde las variables articulares pasivas puedan ser eliminadas del análisis [3].

41

2.6.1.3. Espacio de trabajo: limitantes geométricas y mecánicas Así mismo, también como parte del análisis de posicionamiento y orientación, es necesario hacer énfasis en que no toda posición u orientación puede ser alcanzada por el elemento terminal dadas las limitantes geométricas y mecánicas del mecanismo. Las primeras son impuestas por la movilidad del mecanismo, las dimensiones de los eslabones y la naturaleza de las articulaciones consideradas éstas como ideales. Las últimas resultan de la construcción o implementación real de dichas articulaciones; es decir, los limites de giro y desplazamiento (restricciones) propios de ellas. Ambos tipos de limitantes definen la zona o espacio de trabajo del robot [13]. Dicho espacio de trabajo queda definido por el volumen total barrido por el elemento terminal cuando el manipulador ejecuta todos los posibles movimientos [6], o dicho de otra forma, el volumen encerrado por las superficies que determinan los puntos a los que accede el manipulador con su estructura totalmente extendida o totalmente plegada [5]:

Figura 2.20. Zona de Trabajo ilustrada para un cierto manipulador [12]

La zona de trabajo se subdivide en áreas diferenciadas entre sí: el área de trabajo accesible y el área de trabajo diestra. El área de trabajo accesible queda definida por el conjunto entero de puntos alcanzables por el manipulador en al menos una orientación, mientras que el área de trabajo diestra consiste en los puntos que el manipulador puede alcanzar con cualquier orientación del elemento terminal [6]. No todos los puntos del espacio de trabajo presentan la misma accesibilidad. La superficie que delimita el volumen total del espacio de trabajo representa la accesibilidad mínima, a la que sólo puede accederse con una única orientación. Los puntos de accesibilidad máxima, si existen, pueden encontrarse en el interior del volumen básico. En estos puntos el elemento terminal puede acceder en cualquier dirección [12].

42

2.6.2. Análisis de velocidades Mediante el análisis de velocidades es posible no sólo conocer la localización del elemento terminal del robot, sino también generar trayectorias y que éste las recorra a una cierta velocidad. Como parte de este análisis se modifican la relación cinemática de velocidad obtenida en la sección 2.5.2.3 para considerar la existencia de múltiples marcos de referencia. Así mismo se introduce una matriz denominada como Jacobiana, la cual resulta fundamental en robótica, y se deriva el concepto de singularidad.

2.6.2.1. Relación cinemática de velocidad La ecuación (2-70) especifica la relación de velocidad existente cuando hay movimiento relativo, siendo ésta derivada en su totalidad respecto a un solo marco de referencia. En robótica es común el emplear múltiples marcos de referencia, uno por eslabón, surgiendo así la necesidad de modificar dicha ecuación, la cual para efectos de comparación se reescribe en la ecuación (2-73): v B = v A + Ω × rB / A + v B,rel = v B,trans + v B,rel

(2-73)

Tomando en cuenta el contexto de esta ecuación se define un vector P que va desde el origen de un frame {i} coincidente con el punto A hasta el punto B, y a la vez es especificado en este frame, denotándose entonces como iP. El punto B se mueve con una velocidad relativa al frame {i} al igual que el vector P que lo posiciona, siendo esta velocidad especificada también en dicho frame, por lo que se denota como ivP. Además, el frame {i} rota con respecto al frame {i-1} con una velocidad angular expresada como i-1Ωi y se traslada con respecto a él, siendo la velocidad lineal del origen de {i} especificada con respecto a {i-1} y denotada como

i-1

viorg. Se desea entonces especificar la velocidad de iP

con respecto al frame {i-1}, siendo

i −1 i

R la matriz de rotación que realiza el mapeo

correspondiente entre los frames {i} e {i-1}. De esta forma, la ecuación (2-73) se expresa como: i −1

v P = i −1 v iorg + i −1 Ω i × i −1i R i P + i −1i R i v P

(2-74)

43 La importancia en robótica de la ecuación (2-74) radica en que permite calcular la propagación de velocidad eslabón por eslabón cuando las variables articulares y sus velocidades (i-1Ωi y ivP) se especifican con respecto al frame de cada eslabón.

2.6.2.2. Jacobianas El análisis de velocidades también puede tratarse en dos sentidos opuestos: inverso y directo [3], siendo muy útil la derivación de una matriz denominada como Jacobiana. Matemáticamente la matriz Jacobiana corresponde a la forma multidimensional de la derivada. Suponiendo un sistema de ecuaciones representado de forma matricial, es posible calcular los diferenciales con respecto al tiempo para los elementos de Y en función de los diferenciales con respecto al tiempo para los elementos de X: Y = F(X)

(2-75)

dY ∂F dX = ∂X dt dt

(2-76)

El primer término del lado derecho de la ecuación (2-76) corresponde a una matriz de derivadas parciales llamada Jacobiana, J, por lo que: dY dX = J (X ) dt dt

(2-77)

En robótica, la Jacobiana relaciona las velocidades lineales y angulares de dos eslabones del robot. Así, es posible relacionar la velocidad lineal y angular del elemento terminal, vP y ΩP, y la derivada con respecto al tiempo de las variables articulares, q [1]: ⎡ vP ⎤ dq ⎢Ω ⎥ = J (q ) dt ⎣ P⎦

(2-78)

2.6.2.3. Singularidades La ecuación (2-78) permite realizar el análisis de velocidades directo para el cual sabiendo la variación de las variables articulares es posible determinar la velocidad lineal y angular del elemento terminal. Para el análisis de velocidades inverso es necesario invertir la matriz Jacobiana:

44 ⎡v ⎤ dq = J −1 (q )⎢ P ⎥ dt ⎣Ω P ⎦

(2-79)

La inversa de una matriz es equivalente a la transpuesta de su matriz de cofactores dividida entre su determinante. Entonces, si para una determinada configuración del robot el determinante de la Jacobiana es cero la matriz se dice singular y su inversa no puede ser calculada. En estos casos el robot se encuentra en una configuración singular [3]. Cuando un robot serial se encuentra en una condición singular pierde movilidad. Un robot paralelo, al contrario, puede perderla o ganarla debido a la existencia de articulaciones pasivas. Un robot, serial o paralelo, pierde movilidad en las fronteras del espacio de trabajo en donde por más que aumente la rapidez de cambio en las variables articulares el elemento terminal no puede moverse en cierta dirección. Sin embargo, también es posible perder movilidad dentro del propio espacio de trabajo, debido a configuraciones especiales que dependen de la estructura geométrica y mecánica del mecanismo [1]. Un robot paralelo puede ganar movilidad dentro del espacio de trabajo y se manifiesta cuando el elemento terminal puede moverse en cierta dirección aún si las variables articulares activas se mantienen sin cambio alguno [3].

2.6.3. Análisis de aceleraciones Mediante el análisis de aceleraciones es posible relacionar la cinemática y la dinámica del robot, y así lograr que el elemento terminal ejecute las trayectorias deseadas con la velocidad requerida en cada momento. Para ello se requiere modificar la relación cinemática de aceleración obtenida en la sección 2.5.2.3 y especificada en la ecuación (2-71) para considerar la existencia de múltiples marcos de referencia. Reescribiendo la ecuación (2-71) en la ecuación (2-80): a B = a A + ε × rB / A + Ω × (Ω × rB / A ) + a B,rel + 2Ω × v B,rel = a B,trans + a B,rel + a B,c

(2-80)

Se toma en cuenta la notación empleada para la relación de velocidad (sección 2.6.2.1) y se extiende para el caso de la aceleración, quedando la expresión buscada como: i −1

a P = i −1 a iorg + i −1 ε i × i −1i R i P + i −1 Ω i × ( i −1 Ω i × i −1i R i P )+ i −1i R i a P + 2 i −1 Ω i × i −1i R i v P

(2-81)

45

2.7. Fundamentos de dinámica Mientras la cinemática se ocupa del análisis del movimiento, la dinámica se encarga de la relación entre éste y las fuerzas que lo producen. Para abordar este tema primero se introduce el concepto de fuerza y se describen las fuerzas más comunes que se presentan en el análisis dinámico. Así mismo, también se introduce el concepto de momento. Luego se analiza una de las propiedades de todo cuerpo que afecta directamente su movimiento: su masa. Esto para abordar la ecuación de movimiento y luego extender dicho concepto a cuerpos rígidos. Finalmente, se introducen los conceptos de trabajo y energía.

2.7.1. Fuerza Una fuerza representa la acción de una partícula o cuerpo sobre otro. Ésta puede ser ejercida debido al contacto entre ellos o a distancia, como es el caso de la fuerza de gravedad y las fuerzas electromagnéticas. Una fuerza es una cantidad vectorial, caracterizada por un punto de aplicación, magnitud, dirección y sentido. Las fuerzas que actúan sobre un cuerpo pueden ser clasificadas en dos grupos: •

Fuerzas externas. Representan la acción de otras partículas o cuerpos sobre la partícula o cuerpo analizado. Son enteramente responsables por su comportamiento; es decir, su condición de equilibrio o movimiento.



Fuerzas internas. Son las que mantienen unidas las partículas de un cuerpo [7].

Algunas de las fuerzas externas más comunes que se presentan en el análisis dinámico son las reacciones en las conexiones entre los cuerpos, la fuerza de gravedad y la fricción.

2.7.1.1. Fuerza de gravedad: peso Dos partículas cualesquiera presentan una atracción mutua cuya fuerza, según la ley de gravitación de Newton, está dada por la siguiente expresión matemática: F =G

m1m2 r2

(2-82)

Donde F representa la fuerza de atracción entre dos partículas de masa m1 y m2 separadas una distancia r. El término G representa la constante universal de gravitación:

46 G = 66.73 x10 −12

m3 kg ⋅ s 2

(2-83)

Sin embargo, en el caso de una partícula ubicada en o cerca de la superficie de la Tierra, la única fuerza gravitatoria que tiene magnitud considerable es aquella existente entre la Tierra y la partícula, denominándose fuerza de gravedad en este caso. A esta fuerza comúnmente se le llama peso (W). El peso de un cuerpo no es una cantidad absoluta ya que es medido en un campo gravitatorio, y por consiguiente su magnitud depende de dónde se efectúe la medición. No obstante, para la mayoría de los cálculos se considera una ubicación estándar. Así, conociendo la masa de la tierra (mT) y su radio (rT), se introduce la constante g denominada como aceleración de la gravedad por comparación de unidades: g=

GmT rT2

g ≈ 9.81 m

(2-84)

s2

Así, denominando la masa de la partícula de interés como m, su peso se obtiene [8]: W = mg

(2-85)

2.7.1.2. Fricción Cuando dos superficies entran en contacto siempre aparecen fuerzas tangenciales o de fricción que se oponen al deslizamiento entre ambas superficies. La magnitud de estas fuerzas depende básicamente de la rugosidad de las superficies en cuestión pues a nivel microscópico ninguna superficie es lisa, pudiendo verse como formadas por una serie de “dientes” que se intercalan. Así, cuando una superficie se desliza sobre la otra aparecen fuerzas de contacto que se oponen a dicho deslizamiento. Este hecho se presenta gráficamente en la Figura 2.21 en la cual un bloque se desliza sobre otro y se ilustra un doble acercamiento para observar los efectos de la rugosidad presente en ambos:

47

Figura 2.21. Explicación de la naturaleza de la fricción

Aunque por simplicidad casi todos los objetos se consideran como cuerpos rígidos cuando se analiza su mecánica en realidad todos sufren deformaciones. Así, cuando se presenta el deslizamiento dichos “dientes” se deforman ligeramente y se rompen o vibran debido a efectos de trabazón y arranque sobre la superficie de contacto [8]. La fuerza de fricción es proporcional a la fuerza normal (N) a las superficies en dirección opuesta al desplazamiento (-sgn(v)), siendo la constante de proporcionalidad dependiente de la rugosidad de las superficies y de dos situaciones: Si la fuerza que intenta provocar el deslizamiento es pequeña éste no se presenta, pues las fuerzas de contacto entre los “dientes” no basta para deformarlos. Así, la fuerza de fricción denominada como estática (Fs) balancea a dicha fuerza hasta que llega a un máximo.En cambio, si ocurre el deslizamiento los “dientes” se intercalan en menor medida, presentándose una fuerza de fricción constante denominada como cinética (Fk). Ambas situaciones consideran dos coeficientes de fricción distintos (µs y µk), correspondiendo el primero a la fuerza de fricción estática máxima y el segundo a la fuerza de fricción cinética, el cual generalmente es menor que el primero: Fs ≤ − µ s N sgn (v ) ,

Fk = − µ k N sgn (v )

(2-86)

La aparición de fuerzas de fricción puede ser un efecto deseable o indeseable, siendo posible reducir el coeficiente de fricción seca mediante la utilización de lubricantes, presentándose así fricción viscosa (Fv), la cual es menor y depende de la velocidad del desplazamiento (v) [7]: Fs = µ v v

(2-87)

48

2.7.2. Momento El efecto que produce una fuerza sobre un cuerpo rígido depende de su punto de aplicación, razón por la cual se introduce el concepto de momento de una fuerza: El momento de una fuerza MO con respecto a un punto O se define vectorialmente como el producto cruz de un vector r que indica el punto de aplicación de la fuerza por el vector de dicha fuerza F: MO = r × F

(2-88)

De acuerdo a esta definición la dirección de dicho vector se orienta perpendicularmente al plano que forman los vectores r y F, siendo su magnitud el producto de la fuerza y la distancia perpendicuar d del punto O a la línea de acción de la fuerza (Figura 2.22): M O = Fd

(2-89)

Figura 2.22. Momento de una fuerza [7]

El momento de una fuerza mide la tendencia de la fuerza F para rotar el cuerpo rígido alrededor de un eje dirigido a lo largo del vector MO en el sentido indicado por dicho vector de acuerdo a la regla de la mano derecha. Así mismo, el sentido de rotación también puede ser determinado a partir del sentido de la fuerza F en relación al punto O. Si dos vectores poseen igual magnitud y son antiparalelos no producen fuerza neta alguna, pero sí momento con respecto a un punto O (Figura 2.23). Este vector resultante cuya magnitud es el producto de una de las fuerzas y la distancia que las separa es un vector libre llamado momento de un par o torque y representa la acción exclusivamente rotatoria de dichas fuerzas [7].

49

Figura 2.23. Momento de un par [7]

2.7.3. Masa La masa se refiere a una propiedad que indica la cantidad de materia que un cuerpo posee. Sin embargo, ésta puede estar distribuida arbitrariamente siendo necesario expresar adecuadamente dicha distribución, pues afecta directamente el movimiento del cuerpo. Para ello se introducen dos conceptos: el centro de masa y el momento de inercia.

2.7.3.1. Centro de masa En la sección 2.7.1.1 se presenta la manera de obtener la fuerza de gravedad ejercida por la Tierra sobre una partícula; sin embargo, un cuerpo se encuentra formado por una infinidad de partículas de tal forma que el efecto que la Tierra ejerce sobre él resulta en una gran cantidad de pequeñas fuerzas distribuidas y que pueden ser reemplazadas por una fuerza resultante aplicada en un punto para el cuerpo denominado como centro de masa o centro de gravedad, de tal forma que produzca el mismo momento con respecto a un punto arbitrario que el de las fuerzas distribuidas. Así, para la posición del centro de gravedad rG respecto a un sistema coordenado: rG =

1 rdW W ∫

(2-90)

Se considera tanto la ecuación (2-85) como que la masa quede expresada en términos del volumen V del cuerpo y de su densidad ρ para expresar la ecuación (2-90) como [7]: 1 rdm m∫ 1 rG = ∫ rρ dV m

rG =

(2-91) (2-92)

50

2.7.3.2. Momento de inercia El momento de inercia presenta una medida de la distribución de la masa en un cuerpo con respecto a un determinado eje. Se define el momento de inercia de cada una de las partículas Ii que conforman a un cuerpo como el producto de la masa de la partícula mi por la distancia entre ésta y el eje considerado ri elevada al cuadrado: I i = ri 2 mi

(2-93)

Si cada partícula se considera como un elemento diferencial y se realiza la integración se obtiene el momento de inercia de masa del cuerpo con respecto a dicho eje: I = ∫ r 2 dm

(2-94)

Este momento de inercia también puede quedar expresado en función de la masa total del cuerpo si se define un parámetro denominado como radio de giro k, el cual representa una distancia con respecto al eje a la cual se debería concentrar toda la masa del cuerpo para producir el mismo momento de inercia: I = k 2m

(2-95)

Considerando un sistema coordenado unido a dicho cuerpo, es posible obtener el momento de inercia con respecto a cada uno de sus ejes si se expresa el radio r de la ecuación (2-94) en función de las coordenadas cartesianas mediante el teorema de Pitágoras (Figura 2.24). Así:

(

)

I xx = ∫ y 2 + z 2 dm ,

(

)

I yy = ∫ z 2 + x 2 dm ,

(

)

I zz = ∫ x 2 + y 2 dm

(2-96)

Sin embargo, estos no serán suficientes para representar adecuadamente la distribución de masa en el cuerpo si el sistema coordenado unido a él no es colocado de tal forma que la masa se encuentre distribuida de manera simétrica; entonces es necesario determinar tres cantidades adicionales llamadas productos de inercia [7]: I xy = I yx = ∫ ( xy )dm ,

I yz = I zy = ∫ ( yz )dm ,

I xz = I zx = ∫ ( xz )dm

(2-97)

51

Figura 2.24. Notación para obtener los momentos de inercia respecto a un sistema coordenado [7]

Así, las propiedades inerciales de un cuerpo A pueden quedar completamente caracterizadas por nueve términos, seis de los cuales son independientes entre sí. Estos se ordenan en forma de arreglo denominándose a la matriz resultante como el tensor de inercia I, definido a continuación: ⎡ I xx ⎢ I = ⎢− I yx ⎢ − I zx ⎣

− I xy I yy − I zy

− I xz ⎤ ⎥ − I yz ⎥ I zz ⎥⎦

(2-98)

Si un plano ortogonal del sistema coordenado representa un plano de simetría, los productos de inercia que tengan por subíndice el eje perpendicular a dicho plano valen automáticamente cero, requiriéndose sólo dos planos de simetría para que los tres productos de inercia se anulen y el tensor de inercia quede como matriz diagonal. En dicho caso se denomina a los ejes del sistema coordenado como ejes principales de inercia, pudiendo ser cualquier punto elegido como su origen. Cuando los momentos y productos de inercia con respecto a un sistema coordenado cuyo origen sea el centro de masa del cuerpo son conocidos, entonces es posible determinar un nuevo conjunto de momentos y productos de inercia con respecto a cualquier otro sistema coordenado que presente la misma orientación, mediante el teorema de ejes y planos paralelos (Figura 2.25). Así [8]:

( = (I ) + m(z = (I ) + m(x

I xx = (I x ' x ' )G + m y G2 + z G2 I yy I zz

y' y' G

2 G

+x

2 G

z'z' G

2 G

+y

2 G

) ) )

I xy = (I x ' y ' )G + m( x G y G ) I yz = (I y ' z ' )G + m( y G z G ) I xz = (I x ' z ' )G + m( x G z G )

(2-99)

52

Figura 2.25. Teorema de ejes y planos paralelos [7]

Generalizando las ecuaciones reportadas en (2-99) para el tensor de inercia: ⎡ I xx ⎢ ⎢− I yx ⎢ − I zx ⎣

− I xy I yy − I zy

− I xz ⎤ ⎡ (I x ' x ' )G ⎥ ⎢ − I yz ⎥ = ⎢ − (I y ' x ' )G I zz ⎥⎦ ⎢⎣− (I z ' x ' )G

− (I x ' y ' )G (I y ' y ' )G − (I z ' y ' )G

⎡ yG2 + zG2 ⎢ I = I G + m ⎢ − xG yG ⎢ − xG zG ⎣

⎡ yG2 + zG2 − (I x ' z ' )G ⎤ ⎥ ⎢ − (I y ' z ' )G ⎥ + m ⎢ − xG yG (I z 'z ' )G ⎥⎦ ⎢⎣ − xG zG

− xG yG zG2 + xG2 − yG zG

− xG yG zG2 + xG2 − yG z G

− xG zG ⎤ ⎥ − yG zG ⎥ xG2 + yG2 ⎥⎦

− xG zG ⎤ ⎥ − yG z G ⎥ xG2 + yG2 ⎥⎦

(2-100)

2.7.4. Leyes del movimiento de Newton En 1687 Isaac Newton presentó tres leyes básicas que rigen el movimiento de una partícula. Estas tres leyes del movimiento pueden ser enunciadas como sigue: 1. Una partícula originalmente en reposo, o moviéndose en línea recta con velocidad constante, permanecerá en ese estado siempre que no esté sometida a fuerzas desbalanceadas; es decir, siempre que la fuerza resultante sobre ella sea cero. 2. Una partícula sobre la que actúa una fuerza resultante F experimenta una aceleración que tiene la misma dirección que la fuerza y una magnitud que es proporcional a ella. 3. Las fuerzas mutuas de acción y reacción entre dos partículas son iguales, opuestas y colineales. La segunda ley de Newton puede expresarse matemáticamente de la siguiente manera: F∝a

(2-101)

53 La constante de proporcionalidad necesaria para formular la expresión anterior en forma de ecuación se denomina masa de la partícula m, la cual representa la resistencia de un cuerpo para cambiar la magnitud y/o dirección de su velocidad. Así: F = ma

(2-102)

Donde la expresión (2-102) corresponde a la ecuación de movimiento traslacional para una partícula [8].

2.7.5. Las ecuaciones de movimiento para un cuerpo rígido Mientras que una partícula sólo presenta movimiento traslacional producido por la fuerza neta aplicada a ella, un cuerpo rígido puede presentar tanto movimiento traslacional como rotacional, siendo necesario analizar no sólo los efectos producidos por la fuerza neta aplicada, sino también por el momento neto aplicado a dicho cuerpo. Para este análisis se considera la notación mostrada en la Figura 2.26:

Figura 2.26. Dinámica de un cuerpo rígido

Un cuerpo rígido se encuentra formado por una infinidad de partículas, siendo necesario extender la ecuación de movimiento para poder aplicarla. Para ello debe sumarse vectorialmente esta ecuación aplicada a cada partícula, estando cada una sometida a una fuerza resultante interna (fi) como externa (Fi); sin embargo, la suma de las fuerzas resultantes internas es igual a cero, ya que todas ellas ocurren entre las partículas del cuerpo en pares iguales colineales pero opuestos. Así:

∑F +∑f = ∑m a i

i

i

∑F = ∑m a i

i

i

i

(2-103) (2-104)

54 La ecuación (2-104) puede expresarse de manera diferente si se considera cada partícula como un elemento diferencial y se aplica la definición del centro de masa presentada en la ecuación (2-91) [8]: F=∫

d 2r d2 dm = 2 2 dt dt

(∫ rdm) = dtd

2 2

(mrG ) = m

d 2 rG dt 2

F = ma G

(2-105)

De esta manera el centro de masa de un determinado cuerpo representa un punto específico que caracteriza su movimiento de traslación como si toda su masa se concentrara en una partícula ubicada en dicho punto, lo cual permite en algunos casos considerar el movimiento de un cuerpo como el de una partícula. La ecuación (2-105) puede ser rescrita como: F − (ma G ) = 0

(2-106)

Representando el segundo término de la anterior ecuación una fuerza denominada como inercial, creándose así un equilibrio dinámico. A esto se le conoce como el principio D’Alembert. Para analizar los efectos producidos por los momentos aplicados al cuerpo respecto a un punto P en el espacio se hace producto cruz a la izquierda de ambos lados de la ecuación (2-103) con un vector ri que se dirige desde el punto P hacia cada partícula [8]:

∑ (r × F ) + ∑ (r × f ) = ∑ (r × m a ) i

i

i

i

i

i

i

(2-107)

Al ser los pares de fuerzas resultantes internas colineales comparten el mismo brazo de momento pues la línea de acción es la misma. Sin embargo, por ser opuestas, el momento también lo es. Así, el momento neto producido por ellas es nulo:

∑ (r

i

× Fi ) = ∑ (ri × mi a i )

(2-108)

El término del lado izquierdo de la ecuación (2-108) representa la suma de los momentos netos con respecto al punto P que actúan sobre cada partícula. Si el cuerpo posee aceleración angular α y velocidad angular ω, entonces, usando la ecuación (2-68) y aplicando la identidad u × (v × w ) = (u ⋅ w )v − (u ⋅ v )w se obtiene:

55

∑ (M ) = ∑ (r × m [a + α × r + ω × (ω × r )]) ∑ (M ) = ∑ (r × m [a + α × r + (ω ⋅ r )ω − (ω ⋅ ω)r ]) ∑ (M ) = ∑ m (r × a + r × (α × r ) + (ω ⋅ r )(r × ω ) − ω (r × r )) P i

i

i

P i

i

i

P

i

P

i

i

i

i

2

P i

i

i

P

i

i

i

i

i

(2-109)

i

El último término de la ecuación (2-109) es cero, mientras que el término ri × (α × ri ) puede ser expresado como: ⎡riy (α x riy − α y rix ) − riz (α z rix − α x riz )⎤ ⎥ ⎢ ri × (α × ri ) = ⎢ riz (α y riz − α z riy ) − rix (α x riy − α y rix )⎥ ⎢ rix (α z rix − α x riz ) − riy (α y riz − α z riy )⎥ ⎦ ⎣ ⎡riy2 + riz2 ⎢ ri × (α × ri ) = ⎢ − rix riy ⎢ − rix riz ⎣

− rix riy rix2 + riz2 − riy riz

− rix riz ⎤ ⎥ − riy riz ⎥α rix2 + riy2 ⎥⎦

(2-110)

Así mismo, también el término (ω ⋅ ri )(ri × ω ) puede expresarse como: ⎡ riy ω z − riz ω y ⎤ (ω ⋅ ri )(ri × ω ) = (ω x rix + ω y riy + ω z riz )⎢⎢ riz ω x −rixω z ⎥⎥ ⎢rix ω y − riy ω x ⎥ ⎦ ⎣

( ( (

) ) )

( ( (

⎡ ω y riy2ω z − rix riz ω x − riy riz ω y − ω z riz2ω y − rix riy ω x − riy riz ω z (ω ⋅ ri )(ri × ω ) = ⎢⎢ ω z riz2ω x − rix riy ω y −rix riz ω z − ω x rix2ω z −rix riz ω x − riy riz ω y ⎢ω x rix2ω y − rix riy ω x − riy riz ω z − ω y riy2ω x − rix riy ω y − rix riz ω z ⎣

)⎤ )⎥⎥ )⎥⎦

(2-111)

La ecuación (2-111) puede ser expresada como otro producto cruz si a cada renglón se le suma y resta un determinado término de manera que la matriz no se altere:

(ω ⋅ ri )(ri × ω ) =

⎡ ω y (riy2 ω z − rix riz ω x − riy riz ω y ) + rix2 ω y ω z − ω z (riz2 ω y − rix riy ω x − riy riz ω z ) − rix2 ω y ω z ⎤ ⎢ ⎥ 2 2 2 2 ⎢ ω z (riz ω x − rix riy ω y − rix riz ω z ) + riy ω x ω z − ω x (rix ω z − rix riz ω x − riy riz ω y ) − riy ω x ω z ⎥ ⎢ω x (rix2 ω y − rix riy ω x − riy riz ω z ) + riz2 ω x ω y − ω y (riy2 ω x − rix riy ω y − rix riz ω z ) − riz2 ω x ω y ⎥ ⎣ ⎦

(ω ⋅ ri )(ri × ω ) =

⎡ ω y (rix2 ω z + riy2 ω z − rix riz ω x − riy riz ω y ) − ω z (riz2 ω y + rix2 ω y − rix riy ω x − riy riz ω z )⎤ ⎢ ⎥ 2 2 2 2 ⎢ ω z (riy ω x + riz ω x − rix riy ω y − rix riz ω z ) − ω x (rix ω z + riy ω z − rix riz ω x − riy riz ω y )⎥ ⎢ω x (riz2 ω y + rix2 ω y −rix riy ω x − riy riz ω z ) − ω y (riy2 ω x + riz2 ω x − rix riy ω y − rix riz ω z )⎥ ⎣ ⎦

Así:

(2-112)

56 ⎡riy2 ω x + riz2 ω x − rix riy ω y − rix riz ω z ⎤ (ω ⋅ ri )(ri × ω ) = ω × ⎢⎢ riz2 ω y + rix2 ω y − rix riy ω x − riy riz ω z ⎥⎥ ⎢ rix2 ω z + riy2 ω z − rix riz ω x − riy riz ω y ⎥ ⎦ ⎣ ⎡riy2 + riz2 (ω ⋅ ri )(ri × ω ) = ω × ⎢⎢ − rix riy ⎢ − rix riz ⎣

− rix riy riz2 + rix2 − riy riz

− rix riz ⎤ ⎥ − riy riz ⎥ω rix2 + riy2 ⎥⎦

(2-113)

Tomando en cuenta los anteriores desarrollos la ecuación (2-109) queda como:

∑ (M )

P i

⎛ ⎛ ⎡riy2 + riz2 − rix riy − rix riz ⎤ ⎞ ⎞⎟ ⎜ ⎟ ⎜ ⎜ (∑ m i ri )× a P + ⎜ ∑ m i ⎢⎢ − rix riy rix2 + riz2 − riy riz ⎥⎥ ⎟α + ⎟ ⎜ ⎟ ⎟ ⎜⎜ ⎢ − rix riz − riy riz rix2 + riy2 ⎥⎦ ⎟⎠ ⎟ ⎜ ⎣ ⎝ =⎜ ⎟ ⎛ ⎡riy2 + riz2 − rix riy − rix riz ⎤ ⎞ ⎟ ⎜ ⎟ ⎜ ⎥ ⎟ 2 2 ⎜ω × ⎜ m ⎢ − r r ∑ i ⎢ ix iy rix + riz − riy riz ⎥ ⎟⎟ω ⎟ ⎜ ⎜⎜ 2 2 ⎥⎟ ⎢ − rix riz ⎟ ⎜ r r r r − + iy iz ix iy ⎣ ⎦⎠ ⎝ ⎠ ⎝

(2-114)

La ecuación (2-114) puede expresarse de manera diferente si se considera cada partícula como un elemento diferencial y se aplican las definiciones del centro de masa y del tensor de inercia, presentadas en (2-91), (2-96), (2-97) y (2-98): ⎛ ⎛ ⎡riy2 + riz2 − rix riy − rix riz ⎤ ⎞ ⎞ ⎜ ⎜ ⎟ ⎟ ⎜ ∫ rdm × a P + ⎜ ∫ ⎢⎢ − rix riy rix2 + riz2 − riy riz ⎥⎥ dm ⎟α + ⎟ ⎜ ⎜⎜ ⎢ ⎟⎟ ⎟ 2 2⎥ ⎜ ⎝ ⎣ − rix riz − riy riz rix + riy ⎦ ⎠ ⎟ MP = ⎜ ⎟ ⎛ ⎡riy2 + riz2 − rix riy − rix riz ⎤ ⎞ ⎜ ⎟ ⎜ ⎢ ⎟ ⎥ ⎜ω×⎜ − r r ⎟ 2 2 ∫ ⎢ ix iy rix + riz −2 riy riz2 ⎥ dm ⎟⎟ω ⎜ ⎟ ⎜⎜ ⎢ ⎥ ⎟ ⎜ ⎟ − − + r r r r r r ix iz iy iz ix iy ⎦ ⎠ ⎝ ⎣ ⎝ ⎠

(

)

M P = mrG × a P + I P α + ω × I P ω

(2-115)

Esta ecuación relaciona el momento resultante aplicado al punto P con la aceleración lineal de este punto y el momento de inercia con respecto a él. Sin embargo, la aceleración característica del cuerpo es la de su centro de gravedad, siendo necesario manipular aún más dicha relación. Para expresar la ecuación (2-115) en función del centro de gravedad del cuerpo se hace uso del teorema de ejes y planos paralelos para el tensor de inercia descrito en (2-100), quedando ésta como:

57 ⎛ ⎛ ⎡ yG2 + zG2 − xG yG − xG zG ⎤ ⎞ ⎞⎟ ⎜ ⎜ ⎟ ⎜ mrG × a P + ⎜ I G + m ⎢⎢ − xG yG zG2 + xG2 − yG zG ⎥⎥ ⎟α + ⎟ ⎜ ⎜⎜ ⎢ − xG zG − yG zG xG2 + yG2 ⎥ ⎟⎟ ⎟⎟ ⎜ ⎣ ⎦⎠ ⎝ MP = ⎜ ⎟ ⎛ ⎡ yG2 + zG2 − xG yG − xG zG ⎤ ⎞ ⎜ ⎟ ⎜ ⎟ ⎥ ⎜ ω × ⎜ I + m⎢ − x y ⎟ 2 2 G ⎢ G G zG + xG − yG zG ⎥ ⎟ω ⎜ ⎟ ⎜⎜ ⎢ − xG zG − yG zG xG2 + yG2 ⎥ ⎟⎟ ⎜ ⎟ ⎣ ⎦⎠ ⎝ ⎝ ⎠ ⎞ ⎛ ⎡ y G2 + z G2 − x G y G − x G z G ⎤ ⎟ ⎜ ⎢ ⎥ 2 2 ⎟ ⎜ mrG × a P + m ⎢ − x G y G z G + x G − y G z G ⎥α + ⎟ ⎜ ⎢ − x G z G − y G z G x G2 + y G2 ⎥ ⎟ ⎜ ⎣ ⎦ MP = ⎜ ⎟ 2 2 ⎡ ⎤ y G + z G − xG y G − xG z G ⎟ ⎜ ⎜ + I G α + ω × I G ω + mω × ⎢ − x G y G z G2 + x G2 − y G z G ⎥ω ⎟ ⎢ ⎥ ⎟ ⎜ ⎢ − x G z G − y G z G x G2 + y G2 ⎥ ⎟ ⎜ ⎣ ⎦ ⎠ ⎝

(2-116)

Desarrollando uno a uno los términos involucrados en la ecuación (2-116): ⎡ y G2 + z G2 ⎢ mrG × a P + m ⎢ − x G y G ⎢ − xG z G ⎣

− xG y G z +x 2 G

2 G

− yG zG

− xG z G ⎤ ⎥ − y G z G ⎥α = x G2 + y G2 ⎥⎦

⎡ y G a Pz − z G a Py + y G2 α x + z G2 α x − x G y G α y − x G z G α z ⎤ ⎢ ⎥ = m ⎢ z G a Px − x G a Pz − x G y G α x + z G2 α y + x G2 α y − y G z G α z ⎥ ⎢ x G a Py − y G a Px − x G z G α x − y G z G α y + x G2 α z + y G2 α z ⎥ ⎣ ⎦ ⎡ y G2 + z G2 ⎢ mω × ⎢ − x G y G ⎢ − xG z G ⎣

− xG yG z G2 + x G2 − yG zG

− xG z G ⎤ ⎥ − y G z G ⎥ω = x G2 + y G2 ⎥⎦

⎡ − ω x ω y x G z G − ω y2 y G z G + ω y ω z y G2 + ω x ω z x G y G − ω y ω z z G2 + ω z2 y G z G ⎤ ⎢ ⎥ = m ⎢ ω x ω z z G2 − ω y ω z x G y G − ω z2 x G z G + ω x2 x G z G + ω x ω y y G z G − ω x ω z x G2 ⎥ ⎢− ω x2 x G y G + ω x ω y x G2 − ω x ω z y G z G − ω x ω y y G2 + ω y2 x G y G + ω y ω z x G z G ⎥ ⎣ ⎦

(2-117)

(2-118)

Sustituyendo: ⎛ ⎡ yG aPz − zG aPy + yG2 α x + zG2 α x − xG yGα y − xG zGα z ⎤ ⎞ ⎜ ⎢ ⎟ ⎥ 2 2 ⎜ m ⎢ zG aPx − xG aPz − xG yGα x + zGα y + xGα y − yG zGα z ⎥ + ⎟ ⎜ ⎢ ⎟ 2 2 ⎥ − − − + + x a y a x z α y z α x α y α G Px G G x G G y G z G z⎦ ⎜ ⎣ G Py ⎟ MP = ⎜ ⎟ 2 2 2 2 ⎡ − ω xω y xG zG − ω y yG zG + ω yω z yG + ω xω z xG yG − ω yω z zG + ω z yG zG ⎤ ⎟ ⎜ ⎜ + I G α + ω × I G ω + m ⎢ ω xω z zG2 − ω yω z xG yG − ω z2 xG zG + ω x2 xG zG + ω xω y yG zG − ω xω z xG2 ⎥ ⎟ ⎢ ⎥⎟ ⎜ ⎢− ω x2 xG yG + ω xω y xG2 − ω xω z yG zG − ω xω y yG2 + ω y2 xG yG + ω yω z xG zG ⎥ ⎟ ⎜ ⎣ ⎦⎠ ⎝

Desarrollando el primer término del lado derecho de la ecuación (2-119):

(2-119)

58 ⎡ yG (a Pz + yGα x − xGα y ) − zG (aPy + xGα z − zGα x )⎤ ⎢ ⎥ m ⎢ zG (aPx + zGα y − yGα z ) − xG (a Pz + yGα x − xGα y )⎥ ⎢ xG (aPy + xGα z − zGα x ) − yG (aPx + zGα y − yGα z )⎥ ⎣ ⎦

(2-120)

La ecuación (2-120) puede ser expresada en función de aG si se toma en cuenta la siguiente relación cinemática: a G = a P + α × rG + ω × (ω × rG ) a P + α × rG = a G − ω × (ω × rG ) ⎡ a Px + z Gα y − yGα z ⎤ ⎡ aGx − ω x ω y y G + ω y2 xG + ω z2 xG − ω x ω z z G ⎤ ⎥ ⎥ ⎢ ⎢ 2 2 ⎢ a Py + xGα z − z Gα x ⎥ = ⎢aGy − ω y ω z z G + ω z yG + ω x yG − ω x ω y xG ⎥ ⎢a Pz + yGα x − xGα y ⎥ ⎢ aGz − ω xω z xG + ω x2 z G + ω y2 z G − ω y ω z yG ⎥ ⎦ ⎣ ⎣ ⎦

(2-121)

Sustituyendo las relaciones por renglón expresadas en (2-121) en la ecuación (2-120): ⎡ yG (aGz − ω xω z xG + ω x2 zG + ω y2 zG − ω yω z yG ) − zG (aGy − ω yω z zG + ω z2 yG + ω x2 yG − ω xω y xG )⎤ ⎢ ⎥ m ⎢ zG (aGx − ω xω y yG + ω y2 xG + ω z2 xG − ω xω z zG ) − xG (aGz − ω xω z xG + ω x2 zG + ω y2 zG − ω yω z yG ) ⎥ ⎢ xG (aGy − ω yω z zG + ω z2 yG + ω x2 yG − ω xω y xG ) − yG (aGx − ω xω y yG + ω y2 xG + ω z2 xG − ω xω z zG )⎥ ⎣ ⎦ ⎡ − ω x ω z x G y G + ω y2 y G z G − ω y ω z y G2 + ω y ω z z G2 − ω z2 y G z G + ω x ω y x G z G ⎤ ⎡ a Gz y G − a Gy z G ⎤ ⎢ ⎥ ⎥ ⎢ m ⎢ a Gx z G − a Gz x G ⎥ + m ⎢ − ω x ω y y G z G + ω z2 x G z G − ω x ω z z G2 + ω x ω z x G2 − ω x2 x G z G + ω y ω z x G y G ⎥ ⎢− ω y ω z x G z G + ω x2 x G y G − ω x ω y x G2 + ω x ω y y G2 − ω y2 x G y G + ω x ω z y G z G ⎥ ⎢a Gy x G − a Gx y G ⎥ ⎦ ⎣ ⎣ ⎦

(2-122)

Sustituyendo el anterior resultado en la ecuación (2-119) y simplificando se obtiene la relación buscada: ⎛ ⎡ aGz yG − aGy zG ⎤ ⎡ − ω xω z xG yG + ω y2 yG zG − ω yω z yG2 + ω yω z zG2 − ω z2 yG zG + ω xω y xG zG ⎤ ⎞ ⎜ ⎢ ⎥ ⎟ ⎢ ⎥ ⎜ m ⎢ aGx zG − aGz xG ⎥ + m ⎢ − ω xω y yG zG + ω z2 xG zG − ω xω z zG2 + ω xω z xG2 − ω x2 xG zG + ω yω z xG yG ⎥ + ⎟ ⎜ ⎢ ⎢− ω yω z xG zG + ω x2 xG yG − ω xω y xG2 + ω xω y yG2 − ω y2 xG yG + ω xω z yG zG ⎥ ⎟ ⎥ ⎜ ⎣aGy xG − aGx yG ⎦ ⎦ ⎟ ⎣ MP = ⎜ ⎟ 2 2 2 2 ⎡ − ω xω y xG zG − ω y yG zG + ω yω z yG + ω xω z xG yG − ω yω z zG + ω z yG zG ⎤ ⎟ ⎜ ⎟ ⎜ I G α + ω × I G ω + m ⎢ ω xω z zG2 − ω yω z xG yG − ω z2 xG zG + ω x2 xG zG + ω xω y yG zG − ω xω z xG2 ⎥ ⎥ ⎢ ⎟ ⎜ 2 2 2 2 ⎢− ω x xG yG + ω xω y xG − ω xω z yG zG − ω xω y yG + ω y xG yG + ω yω z xG zG ⎥ ⎟ ⎜ ⎦ ⎣ ⎠ ⎝

M P = rG × ma G + I G α + ω × I G ω

(2-123)

De esta forma, el momento resultante con respecto al punto P equivale al momento generado por la fuerza inercial con respecto a este punto más dos términos dependientes del movimiento angular, donde el tensor de inercia representa la resistencia de un cuerpo para cambiar su velocidad angular, de la misma forma en que la masa lo hace en relación a su velocidad lineal.

59 A la ecuación (2-115) se le conoce como la ecuación de Euler y junto con la (2-105) describen la rotación y traslación de un cuerpo sometido a fuerzas y momentos externos. Así mismo, esta ecuación puede ser expresada de manera similar a como se hizo en la (2-106), para dar lugar al equivalente rotacional del principio de D’Alembert: M P − (rG × ma G + I G α + ω × I G ω ) = 0

(2-124)

2.7.6. Trabajo y energía

2.7.6.1. Trabajo Una fuerza F efectúa trabajo sobre un cuerpo (o partícula) cuando éste experimenta desplazamiento en la dirección de la fuerza. Así, si se considera un desplazamiento diferencial dr recorrido por él, el trabajo U efectuado por la fuerza se expresa como: r2

U1−2 = ∫ F ⋅ dr r1

(2-125)

O de manera alternativa, si el desplazamiento diferencial en dirección de la fuerza se representa de manera escalar como ds, es posible expresar la ecuación (2-125) como: s2

U 1− 2 = ∫ Fds s1

(2-126)

Si el desplazamiento del cuerpo ocurre en la dirección de la fuerza entonces el trabajo efectuado es positivo; en cambio, si ocurre en el sentido opuesto entonces es negativo. Pero si la fuerza actúa perpendicular al desplazamiento, entonces dicha fuerza no trabaja. Cuando el trabajo realizado por una fuerza al mover un cuerpo de un punto a otro es independiente de su trayectoria, entonces esta fuerza se denomina como conservativa. El peso y la fuerza de un resorte son dos ejemplos de fuerzas conservativas encontradas a menudo en mecánica. En caso contrario, la fuerza se denomina como no conservativa. Así mismo, un par también puede efectuar trabajo sobre un cuerpo. Recordando que el momento de un par es un vector libre, el eje de rotación puede ser colocado en medio del par de fuerzas equivalentes de tal forma que la distancia entre cada fuerza y el eje de rotación sea ½ r. De esta forma, dos partículas desplazadas por dichas fuerzas recorren un diferencial de arco de magnitud ½ r dθ. Por consiguiente, el trabajo realizado es:

60 θ2

θ2

θ1

θ1

U1− 2 = 2 ∫ F ( 12 rdθ ) = ∫

(Fr )dθ

θ2

U 1− 2 = ∫ Mdθ θ1

(2-127)

Y de igual forma, si el cuerpo rota en el sentido del momento de par el trabajo realizado es positivo; en caso contrario es negativo. Si no rota no se efectúa trabajo alguno [8].

2.7.6.2. Principio del trabajo y la energía Haciendo uso de la ecuación de movimiento definida en (2-102) en su forma escalar y de la regla de la cadena es posible expresar la ecuación (2-126) como: s2 s2 s2 ⎛ s2 ⎛ s2 ⎛ v2 dv ⎞ dv ds ⎞ dv ⎞ U 1− 2 = ∫ Fds = ∫ (maG )ds = ∫ ⎜ m ⎟ds = ∫ ⎜ m ds = ∫ ⎜ m v ⎟ds = ∫ mvdv ⎟ s1 s1 s1 s1 s1 v1 ⎝ ds dt ⎠ ⎝ ds ⎠ ⎝ dt ⎠



s2

s1

v2

Fds = ∫ mvdv v1

(2-128)

Integrando el lado derecho de la ecuación (2-128) y reordenando términos:



s2

1 2

mv12 + ∫ Fds = 12 mv 22

s1

Fds = 12 mv 22 − 12 mv12 s2

s1

(2-129)

Esta ecuación representa el principio del trabajo y la energía para una partícula, donde los términos ubicados a los extremos definen su energía cinética inicial T1 y final T2 con respecto a un trabajo efectuado sobre ella: T1 + U 1− 2 = T2

(2-130)

El principio del trabajo y la energía puede ser ampliado para un cuerpo rígido si éste se considera como formado por infinidad de partículas. Así, la energía cinética del cuerpo corresponde a la suma de la energía cinética de cada partícula: T = ∑ Ti = ∑ 12 mi v i2

(2-131)

La velocidad de cada partícula puede ser relacionada con la del centro de gravedad vG mediante la correspondiente relación cinemática si se define un vector ri que va del centro de gravedad a cada partícula:

61 1 2

1 2 1 2

m i v i2 = 12 m i (v i ⋅ v i )

m i v i2 = 12 m i ([v G + ω × ri ]⋅ [v G + ω × ri ])

(

)

m i v i2 = 12 m i v G2 + 2 v G ⋅ (ω × ri ) + (ω × ri ) ⋅ (ω × ri )

(2-132)

Se desarrolla el último término del lado derecho de la ecuación (2-132):

(ω × ri ) ⋅ (ω × ri ) = (ω y riz − ω z riy )2 + (ω z rix − ω x riz )2 + (ω x riy − ω y rix )2 ⎛ ω x2 (riy2 + riz2 ) + ω y2 (riz2 + rix2 ) + ω z2 (rix2 + riy2 )⎞ ⎟ ⎟ ⎝ − 2ω yω z riy riz − 2ω xω z rix riz − 2ω xω y rix riy ⎠ ⎛ ω x (ω x (riy2 + riz2 ) − ω y rix riy − ω z rix riz ) + ⎞ ⎜ ⎟ (ω × ri ) ⋅ (ω × ri ) = ⎜ ω y (− ω x rix riy + ω y (riz2 + rix2 ) − ω z riy riz ) + ⎟ ⎜ ⎟ ⎜ ω z (− ω x rix riz − ω y riy riz + ω z (rix2 + riy2 )) ⎟ ⎝ ⎠ ⎡riy2 + riz2 − rix riy − rix riz ⎤ (ω × ri ) ⋅ (ω × ri ) = ω ⋅ ⎢⎢ − rix riy riz2 + rix2 − riy riz ⎥⎥ω ⎢ − rix riz − riy riz rix2 + riy2 ⎥ ⎣ ⎦

(ω × ri ) ⋅ (ω × ri ) = ⎜⎜

(2-133)

Aprovechando el anterior resultado sustituido en la ecuación (2-132), la ecuación (2-131) se puede expresar de manera diferente si se considera cada partícula como un elemento diferencial y se aplican las definiciones del centro de masa y del tensor de inercia, presentadas en (2-91), (2-96), (2-97) y (2-98): ⎛ ⎡riy2 + riz2 − rix riy − rix riz ⎤ ⎞ ⎜ ⎢ ⎥ ⎟ 2 2 2 1 T = 2 ∫ ⎜ v G + 2 v G ⋅ (ω × ri ) + ω ⋅ ⎢ − rix riy riz + rix − riy riz ⎥ω ⎟dm ⎜⎜ ⎟ ⎢ − rix riz − riy riz rix2 + riy2 ⎥⎦ ⎟⎠ ⎣ ⎝ ⎛ ⎡riy2 + riz2 − rix riy − rix riz ⎤ ⎞ ⎜ ⎢ ⎥ ⎟ 2 2 2 T = 12 ∫ dm v G + v G ⋅ ω × ∫ rdm + 12 ω ⋅ ⎜ ∫ ⎢ − rix riy riz + rix − riy riz ⎥ dm ⎟ω ⎜⎜ ⎢ ⎟ − riy riz rix2 + riy2 ⎥⎦ ⎟⎠ ⎝ ⎣ − rix riz

( )

(

)

T = 12 mv G2 + v G ⋅ (ω × mrG ) + 12 ω ⋅ I G ω

(2-134)

Sin embargo, al tomar para la relación cinemática de velocidad como punto base el centro de gravedad G, el vector rG que posiciona a dicho centro de gravedad con respecto al punto base es cero. De esta forma se obtiene la expresión buscada para la energía cinética de un cuerpo rígido: T = 12 mv G2 + 12 ω ⋅ I G ω

(2-135)

62 Es decir, que la energía cinética posee una componente traslacional y otra rotatoria. Si se consideran varios cuerpos, entonces la energía cinética total del sistema equivale a la suma de la energía cinética traslacional y rotatoria individual de cada uno. Así, si un cuerpo o sistema de cuerpos posee una energía cinética inicial y se realiza trabajo sobre él, entonces la energía cinética del sistema cambia según el principio del trabajo y la energía, ocurriendo así un balance de energía:

∑ T + ∑U 1

1− 2

= ∑ T2

(2-136)

Para mantener dicho balance debe tomarse en cuenta estrictamente el trabajo realizado por todas las fuerzas y momentos de par. Con respecto a esto cabe recordar que las fuerzas internas sobre partículas adyacentes ocurren en pares colineales iguales pero opuestos; sin embargo, no forzosamente el trabajo efectuado por dichas fuerzas internas se cancela ya que las trayectorias sobre las que las partículas correspondientes viajan pueden ser diferentes. Esto ocurre cuando el cuerpo considerado no es rígido o aún cuando para un determinado análisis se modela como rígido pero también se toman en cuenta las fuerzas de fricción, pues involucran deformaciones, vibraciones y rupturas a niveles microscópicos (ver sección 2.7.1.2) pero que sí ocasionan pérdidas de energía, térmicas o sonoras. Sin embargo, en general para un cuerpo rígido las fuerzas internas no se consideran en el análisis, pues ningún movimiento relativo ocurre entre ellas y no se realiza trabajo interno. Así mismo, cuando varios cuerpos rígidos están conectados por medio de pasadores, cables inextensibles o acoplados entre sí, el principio del trabajo y energía puede ser aplicado a todo el sistema de cuerpos conectados. En todos estos casos las fuerzas internas que mantienen juntos los diversos miembros no trabajan y son eliminadas del análisis [8].

2.7.6.3. Conservación de la energía La energía puede ser definida como la capacidad de efectuar un trabajo y en general pueden ser definidos varios tipos de energía, siendo los más importantes en el análisis mecánico la energía cinética y potencial. Cuando la energía proviene del movimiento se denomina energía cinética, pero si proviene de la posición con respecto a un plano de referencia en presencia de fuerzas conservativas, se denomina energía potencial.

63 Así, la energía potencial V puede ser gravitatoria Vg y/o elástica Ve, dependiendo de la fuerza conservativa presente. Denotando como yG la posición del centro de gravedad del objeto sobre el plano de referencia, W el peso del objeto, k la constante del resorte y s la distancia de alargamiento o compresión de dicho resorte, ambos tipos de energía potencial se pueden definir como: VG = Wy G ,

V e = + 12 ks 2

(2-137)

Cuando un sistema de fuerzas conservativas U 1−(c 2) y no conservativas U1−(nc2 ) actúa sobre un cuerpo, la porción del trabajo realizado por las fuerzas conservativas puede ser escrita en términos de la diferencia en sus energías potenciales:

∑U ( )

c 1− 2

= V1 − V2

(2-138)

Y así, el principio del trabajo y la energía definido en (2-136) puede ser escrito como a continuación se muestra:

∑T + ∑U ( ) + ∑U ( ) = ∑ T ∑ T + ∑ (V − V ) + ∑ U ( ) = ∑ T ∑ T + ∑V + ∑U ( ) = ∑ T + ∑V c 1− 2

1

1

1

1

nc 1− 2

2

nc 1− 2

1

2

nc 1− 2

2

2

2

(2-139)

Entonces, cuando sólo fuerzas conservativas son aplicadas al cuerpo se dice que la energía mecánica del sistema se conserva, pudiéndose expresar la ecuación (2-139) de la siguiente manera [8]:

∑ T + ∑V = ∑ T + ∑V 1

1

2

2

(2-140)

2.8. Dinámica aplicada al ámbito de la robótica El análisis cinemático considera sólo las relaciones de localización, velocidad y aceleración entre los diferentes eslabones de un robot; sin embargo, es necesario aplicar una serie de fuerzas y/o torques en sus articulaciones activas por medio del correspondiente sistema de actuación para así efectuar cierto movimiento en tiempo del elemento terminal, requiriéndose así un análisis dinámico.

64 Como parte de este análisis primero se extiende la definición del tensor de inercia para considerar que los eslabones del robot pueden estar localizados de manera arbitraria respecto al marco de referencia fijo. Esto para luego describir los denominados problemas dinámicos inverso y directo, así como las estrategias más populares empleadas en la resolución de estos problemas. Finalmente se define la forma general del modelo dinámico a la que se puede llegar mediante cualquier estrategia de resolución: la ecuación del espacio de estados.

2.8.1. Transformación del tensor de inercia El tensor de inercia fue definido en la sección 2.7.3.2 como una manera de caracterizar la distribución de masa en un cuerpo, para el cual se escoge un sistema coordenado unido a él sobre el cual definir dicho tensor de manera que sea constante. Los eslabones que forman a un robot son cuerpos para los cuales se especifica como parámetro su tensor de inercia. Mientras que el análisis cinemático puede efectuarse con respecto a un marco de referencia arbitrario, el análisis dinámico sólo puede hacerse sobre un marco de referencia denominado como inercial; esto es, que sea fijo. Es decir, que dicho análisis se realiza siempre sobre el frame unido a la base del robot, surgiendo así la necesidad de expresar los tensores de inercia de los eslabones con respecto a él, tomando en cuenta que estos pueden poseer una orientación arbitraria. Suponiendo que el marco de referencia inercial es denotado como {U} y que se desea expresar el tensor de inercia del eslabón i definido en {i} con respecto a {U}, se emplea una matriz de rotación que realice el correspondiente mapeo. Así: U

I i = Ui R⋅i I i

(2-141)

Sin embargo, en cualquier análisis dinámico siempre el tensor de inercia multiplica a un vector A definido en {U}. Por ello, es necesario primero mapear dicho vector al frame del eslabón antes de realizar la multiplicación, mediante la correspondiente matriz de rotación: U

I i ⋅ Ui R T ⋅ U A

(2-142)

65 Por comodidad, dicho mapeo puede integrarse a la transformación del tensor de inercia, quedando éste denotado como

U U i

I para diferenciar la notación de la usada en (2-141) y

(2-142) e indicar que el tensor de inercia pertenece al eslabón i al mismo tiempo que transforma a un vector expresado en {U} y arroja un resultado también en {U}. Así [3]: U U

I i = Ui R⋅ i I i ⋅ Ui R T

(2-143)

2.8.2. Dinámica inversa y directa El análisis dinámico puede también tratarse en dos sentidos opuestos: •

La dinámica inversa consiste en determinar las fuerzas y/o torques necesarias como función del tiempo para producir un cierto movimiento con la velocidad y aceleración deseadas sobre una trayectoria.



La dinámica directa consiste en determinar cual será el correspondiente movimiento que producirán una serie de fuerzas y/o torques dados en las articulaciones activas.

La dinámica inversa encuentra su aplicación en la implementación de lazos de control para el robot, mientras que la dinámica directa generalmente se usa en el desarrollo de simuladores que permitan predecir el comportamiento del sistema [3].

2.8.3. Estrategias de resolución Para efectuar el análisis dinámico existen varios métodos o estrategias de resolución, siendo algunos de los más populares el de Newton-Euler, la formulación del Lagrangiano y el método del trabajo virtual:

2.8.3.1. Método recursivo de Newton-Euler El método recursivo de Newton-Euler consiste en definir las ecuaciones de movimiento para cada eslabón del robot y a partir de ahí efectuar el análisis pues se genera un sistema de ecuaciones en función tanto de las fuerzas y/o torques aplicadas como de las fuerzas de contacto, las cuales son eliminadas a partir de relaciones cinemáticas.

66 Este método encuentra su aplicación generalmente en el análisis de robots seriales, ya que para el caso de robots paralelos genera un gran número de ecuaciones y por ello representa un método muy poco eficiente, computacionalmente hablando. El método consiste en un cálculo “hacia delante” de la propagación de las velocidades y aceleraciones, lineales y angulares de un eslabón a otro, partiendo de la base hacia el elemento terminal, seguido de un cálculo “hacia atrás” de las fuerzas y momentos presentes en cada articulación, partiendo del elemento terminal hacia la base. El cálculo de propagación de las velocidades y aceleraciones lineales se lleva a cabo a partir de un análisis de movimiento relativo a partir de las expresiones mencionadas en las secciones 2.6.2 y 2.6.3, mientras que el de las velocidades y aceleraciones angulares a partir de una suma vectorial, de acuerdo a los conceptos presentados en la sección 2.5.2.1. Estas cantidades deben expresarse además en el frame correspondiente a cada eslabón durante la propagación mediante la correspondiente matriz de transformación. Así, una vez que las velocidades y aceleraciones de cada eslabón son determinadas, las fuerzas y torques en cada uno son determinadas a partir de las ecuaciones de Newton para movimiento traslacional y de Euler para movimiento rotacional definidas en la sección 2.7.5. Las correspondientes fuerzas o torques en las articulaciones se obtienen a partir de proyectar éstas sobre el eje de cada articulación [3].

2.8.3.2. Formulación del Lagrangiano La formulación del Lagrangiano es un método comprendido dentro de la llamada dinámica analítica, la cual consiste en una serie de técnicas basadas en el tratamiento puramente abstracto y analítico de los sistemas mecánicos. Este método fue formulado por Joseph Louis Lagrange y tiene la ventaja de que deja fuera del análisis a las fuerzas de contacto mediante la definición de coordenadas y fuerzas generalizadas. Se denominan coordenadas generalizadas a un conjunto de n parámetros qi que sirven para determinar de manera unívoca la configuración del sistema. Estos parámetros pueden ser cualesquiera, sin necesitar ser homogéneos en cuanto a sus dimensiones. Para un robot estas coordenadas corresponden a las variables articulares activas.

67 Un conjunto de coordenadas se denomina libre cuando éstas se pueden variar de manera independiente entre sí; es decir, se pueden escoger de manera arbitraria. Así, se pueden definir n coordenadas para un sistema con n grados de libertad, como es el caso de los robots seriales. En caso de no ser así, es porque existen restricciones holónomas o no holónomas que causan que dichas coordenadas dependan entre sí [14]. Una restricción se dice holónoma si ésta se puede representar mediante una ecuación algebraica en función de las coordenadas y el tiempo; en caso contrario, se dice no holónoma. Cuando las coordenadas generalizadas no son libres, el número de grados de libertad es diferente a n. Éste es el caso de los robots paralelos, para los cuales es necesario formular las ecuaciones de restricción necesarias de manera que el número de ecuaciones iguale al número de incógnitas, lo cual complica el método mientras mayor sea la movilidad del mecanismo. Es por ello que este método generalmente se usa para el análisis dinámico de robots seriales. Las fuerzas generalizadas Qi representan todas las fuerzas no conservativas ni inerciales que son consistentes con las restricciones mecánicas del sistema, y que no representan reacciones de contacto, pudiendo así englobar tanto a una fuerza f como a un torque τ, según la correspondiente coordenada generalizada sobre la que actúa [3]. Para la formulación del Lagrangiano es necesario además introducir el concepto de la función Lagrangiana y de las ecuaciones de Lagrange: La función Lagrangiana (L) se define como la diferencia entre la energía cinética y potencial de un sistema. Así, de acuerdo a la notación manejada en la sección 2.7.6, ésta se expresa como: L = T −V

(2-144)

En la ecuación (2-135) fue definida la energía cinética de un cuerpo. Considerando la transformación de la matriz de inercia en (2-143) y que la relación de velocidades entre el elemento terminal y las articulaciones activas está determinada por una Jacobiana Ji (ecuación (2-78)), la cual puede subdividirse en dos submatrices J i = [J vi

J ωi ]T que

relacionen las velocidades lineales y angulares respectivamente, entonces la energía cinética puede ser expresada para todo el sistema como:

68 T=

∑ (v n

1 2

i =1

T Gi

mv Gi + ω Ti UU I i ω i

)

T T ⎛⎛ dq ⎞ ⎛ dq ⎞ ⎛ dq ⎞ U ⎛ dq ⎞ ⎞⎟ ⎜ T = ∑ ⎜ J vi ⎟ m⎜ J vi ⎟ + ⎜ J ωi ⎟ U I i ⎜ J ωi ⎟ ⎜ dt ⎠ ⎝ dt ⎠ ⎝ dt ⎠ dt ⎠ ⎟⎠ ⎝ i =1 ⎝ ⎝ dq dq T n J viT mJ vi + J ωTi UU I i J ωi T = 12 ∑ dt dt i =1 n

1 2

(

)

(2-145)

El término medio del lado derecho de la ecuación se denota como la matriz M. Así: T=

1 2

dq T dq M dt dt

(2-146)

En cuanto a la energía potencial se considera que los eslabones almacenan energía potencial gravitatoria en el caso más general, la cual fue definida en la ecuación (2-137) junto con la elástica. Definiendo como rGi la posición del centro de gravedad de cada eslabón y tomando en cuenta la definición de peso dada en la ecuación (2-85) se puede expresar la energía potencial para todo el sistema como: n

V = −∑ m i g T rGi

(2-147)

i =1

Donde el vector de la aceleración de la gravedad g se considera actuando en sentido contrario al eje Z del marco inercial, de ahí el signo negativo en la ecuación (2-147). Así: g = [0 0 − 9.81]

T

(2-148)

Sustituyendo las ecuaciones (2-146) y (2-147) en la (2-144) se obtiene: dq T dq n M + ∑ m i g T rGi dt dt i =1 n n n dq i dq i + ∑ m i g T rGi L = 12 ∑ ∑ M ij dt dt i =1 i =1 j =1 L=

1 2

(2-149)

Donde Mij corresponde al elemento (i, j) de la matriz de inercia M. Las ecuaciones de Lagrange se formulan en términos de la función Lagrangiana y representan un sistema de ecuaciones diferenciales definido como: ⎞ ∂L d ⎛ ∂L ⎜⎜ ⎟− = Qi , dt ⎝ ∂ (dq i dt ) ⎟⎠ ∂q i

para i = {1, 2, …, n}

(2-150)

69 Sustituyendo la ecuación (2-149) en la (2-150) y desarrollando se obtiene [3]: n ⎛1 n n ⎞⎞ ∂ dq i dq i ∂ d ⎛⎜ ⎜ 2 ∑ ∑ M ij + m i g T rGi ⎟⎟ ⎟ − ∑ ⎟ dt ⎜⎝ ∂ (dq i dt ) ⎜⎝ i =1 j =1 dt dt i =1 ⎠ ⎠ ∂q i

n ⎛1 n n ⎞ dq i dq i ⎜ 2 ∑ ∑ M ij + m i g T rGi ⎟⎟ = Qi , ∑ ⎜ dt dt i =1 ⎝ i =1 j =1 ⎠

para i = {1, 2, …, n} n ⎞ dq ⎞ ⎛ n n ∂M jk dq j dqk d ⎛ n ⎜ ∑ M ij i ⎟ − ⎜ 12 ∑∑ m j g T J ivj ⎟⎟ = Qi , para i = {1, 2, …, n} + ∑ dt ⎟⎠ ⎜⎝ j =1 k =1 ∂qi dt dt dt ⎜⎝ j =1 j =1 ⎠

n n ∂M n ⎛ n ⎛ n n ∂M jk dq j dqk ⎞ d 2 qi ij dq j dq k ⎞ ⎜ ∑ M ij ⎟ − ⎜ 12 ∑∑ + + m j g T J ivj ⎟⎟ = Qi , ∑∑ ∑ 2 ⎜ ⎟ ⎜ dt ∂ q dt dt ∂ q dt dt j =1 k =1 j =1 k i ⎝ j =1 ⎠ ⎝ j =1 k =1 ⎠

para i = {1, 2, …, n} d 2 qi

n

∑M j =1

ij

dt

2

n n ⎛ ∂M ∂M jk ij + ∑ ∑ ⎜⎜ − 12 ∂q i j =1 k =1 ⎝ ∂q k

n ⎞ dq j dq k , para i = {1, 2, …, n} T i ⎟ ⎟ dt dt − ∑ m j g J vj = Qi j = 1 ⎠

(2-151)

Donde J ivj corresponde a la i-ésima columna de la submatriz Jvj. Así, el análisis dinámico del sistema se efectúa resolviendo el sistema de ecuaciones diferenciales presentado en (2-151).

2.8.3.3. Principio del Trabajo Virtual El principio del trabajo virtual representa un método de análisis que engloba el concepto del trabajo virtual y el principio de D’Alembert, mediante los cuales se formulan directamente las ecuaciones dinámicas de manera conjunta para todo un sistema, y no partícula a partícula [14]. Esta característica también se presenta con la formulación del Lagrangiano; sin embargo, el principio del trabajo virtual no involucra los inconvenientes presentes cuando las coordenadas generalizadas no son libres, representando así el método más eficiente en el análisis de robots paralelos [3]. Para describir concepto del trabajo virtual es necesario primero introducir el concepto de los desplazamientos virtuales: En un sistema de N partículas se denomina así a un conjunto de desplazamientos infinitesimales arbitrarios de cada partícula del sistema. En contraposición a los desplazamientos infinitesimales reales, los desplazamientos virtuales δr son un concepto abstracto que sirve para formular el concepto de trabajo virtual; se trata de desplazamientos ficticios, inventados, que tienen lugar en un instante “congelado” de tiempo.

70 Por el contrario, los desplazamientos infinitesimales reales dr se producen en el movmimiento real, durante un intervalo de tiempo dt, y se pueden expresar como un diferencial en funciones que definen el movimiento. Se considera un conjunto de coordenadas y fuerzas generalizadas, donde estas últimas son consistentes con las restricciones mecánicas del sistema. Así, si estas fuerzas generalizadas producen un desplazamiento virtual el cual por su definición puede considerarse consistente con dichas restricciones, entonces se produce un trabajo virtual δW que, por la definición de trabajo expresada en la sección 2.7.6.1 y la naturaleza de los desplazamientos virtuales, es nulo [14]. δW = ∑ Q i ⋅ δri = 0 i

(2-152)

Donde Qi y δri representan vectores de fuerzas generalizadas y desplazamientos virtuales. Dichas fuerzas generalizadas tal y como fueron definidas en la sección 2.8.3.2 no incluyen las fuerzas de contacto entre los elementos del sistema; sin embargo, las fuerzas de fricción cuando no son despreciadas, sí son incluidas en el análisis pues representan fuerzas no conservativas y pérdidas energéticas, como se menciona en la sección 2.7.6.2. La ecuación (2-152) permite analizar al sistema de manera estática; sin embargo, es posible extender dicho concepto al análisis dinámico si se consideran las fuerzas y momentos inerciales definidos en las ecuaciones (2-106) y (2-124). Así, si dichas fuerzas y momentos inerciales son agrupados como fuerzas generalizadas inerciales Qi*, el principio de D’Alembert puede escribirse de la siguiente manera:

∑ (Q

i

)

− Q *i = 0

(2-153)

Entonces, el trabajo virtual para el análisis dinámico queda expresado como [14]: δW = ∑ (Q i − Q *i )⋅ δri = 0 i

(2-154)

Para aplicar el principio del trabajo virtual expresado en la ecuación (2-154) a un sistema robótico se define un vector combinado de fuerzas netas fi y momentos de par netos ni actuando sobre un eslabón i, denominado como vector llave Fi del eslabón i, así como un vector llave inercial Fi* del eslabón i:

71 Fi = [f i

[

T τi ] ,

Fi* = f i*

τ *i

]

T

(2-155)

Así, si el desplazamiento virtual de cada eslabón i se denota como δxi y el del elemento terminal p como δxp, mientras que el de las coordenadas generalizadas o variables articulares activas se denota como δq = δ [q1

q 2 K q n ], sobre las cuales se ejerce una

fuerza generalizada Q, el principio del trabajo virtual puede ser expresado como [3]: δq T Q + ∑ δx Ti (Fi − Fi* ) + δx pT (Fp − Fp* ) = 0 i

(2-156)

Los desplazamientos virtuales involucrados en la ecuación (2-156) pueden quedar todos relacionados con el desplazamiento virtual del elemento terminal si se considera la similitud existente entre un desplazamiento virtual y un desplazamiento infinitesimal real y se recuerda la relación mantenida por la matriz Jacobiana expresada en (2-77), denotada como Ji si relaciona el elemento terminal y el eslabón i, o como Jf si relaciona el elemento terminal y las variables articulares activas. Así: δx x = J x δx p

(2-157)

δx Tx = δx pT J Tx

(2-158)

Si la ecuación expresada en (2-158) se usa en (2-152), puede demostrarse que si la Jacobiana relaciona velocidades, su transpuesta relaciona fuerzas generalizadas; es decir, expresa una fuerza generalizada actuando en un eslabón, reflejada sobre otro [1]: δx Tx Q x = δx pT J Tx Q p Q x = J Tx Q p

(2-159)

Así, la relación expresada en (2-158) puede usarse en la ecuación (2-156), y así desarrollarse para obtener la relación cinemática buscada [3]: δx pT J fT Q + ∑ δx pT J Ti (Fi − Fi* ) + δx pT (Fp − Fp* ) = 0 i

⎛ ⎞ δx pT ⎜ J fT Q + ∑ J Ti Fi − Fi* + Fp − Fp* ⎟ = 0 i ⎝ ⎠ ⎛ ⎞ − ⎜ ∑ J Ti Fi − Fi* + Fp − Fp* ⎟ = J fT Q ⎝ i ⎠

(

(

) (

) (

)

)

(2-160)

72

2.8.4. La ecuación del espacio de estados La estructura general del modelo dinámico para un sistema mecánico corresponde a la denominada ecuación del espacio de estados, cuya forma general en función de un vector de coordenadas generalizadas q es: M(q )

d 2q dq ⎛ dq ⎞ ⎛ dq ⎞ + V⎜ q, ⎟ + G (q ) + FV + FS sgn⎜ ⎟ + E = Q 2 dt dt ⎝ dt ⎠ ⎝ dt ⎠

(2-161)

La matriz nxn denominada como M es llamada la matriz de masa o inercia del sistema, la cual depende del vector de coordenadas generalizadas y multiplica a la segunda derivada con respecto al tiempo de dicho vector. El vector nx1 denominado como V es llamado el vector de términos centrífugos y de Coriolis. Este vector depende tanto del vector de coordenadas generalizadas como de su derivada con respecto al tiempo y surge a partir de los términos que dependen de la velocidad angular en las relaciones de aceleración incluidas en el modelo. A partir de los desarrollos presentados en la sección 2.5.2.3 se observa que dichos términos corresponden a la componente de aceleración normal o llamada también centrífuga y la aceleración de Coriolis, de ahí el nombre de este vector. El vector nx1 denominado como G corresponde al vector de términos gravitatorios, el cual depende del vector de coordenadas generalizadas y la aceleración de la gravedad [1]. La matriz nxn denominada como FV representa la matriz de coeficientes de fricción viscosa, la cual multiplica a la segunda derivada del vector de coordenadas generalizadas, mientras que el vector nx1 denominado como FS representa el vector de coeficientes de fricción seca, cuyo signo depende de la dirección de cambio del vector de coordenadas generalizadas. Es preciso remarcar la concordancia de estas definiciones con la descripción de los diferentes tipos de fricción presentada en la sección 2.7.1.2. Finalmente, el vector nx1 denominado como E representa las fuerzas y momentos externos de carga aplicados al sistema mecánico, mientras que el vector nx1 denominado como Q representa las fuerzas generalizadas aplicadas como entradas al sistema. No importa el método de análisis aplicado, al final todos llegan a una ecuación que puede expresarse en la forma de la ecuación del espacio de estados, homogeneizándose así su representación con la ventaja adicional de que sus términos poseen un sentido físico.