Vol. 2, núm. 2 mayo-agosto 2009 - INEGI

que todos los puntos están muy cercanos a dicha trayectoria; por mencionar algunos, se tiene que de los puntos en la parte superior que corresponden a las delegaciones Iztapalapa, Cuauhtémoc y Gustavo A. Madero y del muni- cipio de Ecatepec de Morelos, ámbitos en los que se efectúa el mayor núme- ro de viajes al ...
3MB Größe 54 Downloads 80 vistas
Boletín del Sistema Nacional de Información Estadística y Geográf ica. Vol. 2, núm. 2, mayo-agosto 2009

MÉXICO www.inegi.org.mx

• Análisis para elaborar un catálogo Anita Estela Lozano Hube (INEGI).

3

• Análisis comparativo de la teoría clásica de ajustes con respecto a la teoría de valores extremos en la distribución de los máximos de los ingresos

30

• El valor del alquiler de la vivienda en México

54

• Los viajes en la Zona Metropolitana del Valle de México. Resultados de la Encuesta Origen-Destino de la ZMVM 2007 bajo un enfoque exploratorio de datos

67

• Panorama actual de la Geografía en México y en el estado de San Luis Potosí

94

José Luis Ángel Rodríguez Silva (INEGI). Jael Pérez Sánchez (INEGI).

Ricardo Rodarte García (INEGI).

Carlos Contreras Servín (UASLP).

• Propuesta metodológica para medir la reproducción precaria Guadalupe Margarita González Hernández (UAZ).

Vol. 2, núm. 2 mayo-agosto 2009

101

Vol. 2, núm. 2, mayo-agosto 2009

Boletín del Sistema Nacional de Información Estadística y Geográfica

Directorio

Grupo Editorial

Junta de Gobierno

Eduardo Sojo Garza-Aldape Presidente del Instituto Enrique de Alba Guerra José Antonio Mejía Guerra Mario Palma Rojo María del Rocío Ruiz Chávez

Dirección General de Estadísticas Sociodemográficas Miguel Cervera Flores

Dirección General de Estadísticas Económicas Arturo Blancas Espejo

Dirección General de Geografía y Medio Ambiente Mario Alberto Reyes Ibarra

Dirección General del Servicio Público de Información Enrique Ordaz López

Dirección General de Coordinación del Sistema Nacional de Información Estadística y Geográfica Norberto de Jesús Roque Díaz de León

Dirección General de Vinculación Estratégica Alberto Manuel Ortega y Venzor

Dirección General de Administración Froylán Rolando Hernández Lara

Alberto Manuel Ortega y Venzor

Coordinación Editorial

Gerardo Leyva y Parra, Virginia Abrín Batule y Mercedes Pedrosa Islas

Corrección de Estilo

José Pablo Covarrubias Ordiales, Laura Elena López Ortiz y Marcelo Garcilita Sánchez

Arte y Diseño

Juan Carlos Martínez Méndez, Eduardo Javier Ramírez Espino y Juan Sergio Salvador Flores Ponce

Instituto Nacional de Estadística y Geografía Edificio sede Av. Héroe de Nacozari sur núm. 2301 Fracc. Jardines del Parque, CP 20276 Aguascalientes, Ags.

Boletín del Sistema Nacional de Información Estadística y Geográfica es una publicación cuatrimestral. El contenido de los artículos, así como sus títulos y, en su caso, fotografías y gráficos utilizados son responsabilidad del autor, lo cual no refleja, necesariamente, el criterio editorial. Asimismo, el Boletín se reserva el derecho de modificar los títulos de los artículos, previo acuerdo con los autores. La mención de empresas o productos específicos en las páginas del Boletín no implica su respaldo por el Instituto Nacional de Estadística y Geografía. Toda correspondencia deberá dirigirse a: [email protected]. Boletín del Sistema Nacional de Información Estadística y Geográfica, publicación cuatrimestral mayo-agosto 2009. Número de Certificado de Reserva otorgado por el Instituto Nacional del Derecho de Autor: 04-2008-112517584500-106. Número de Certificado de Licitud de Título: en trámite. Número de Certificado de Licitud de Contenido: en trámite. Domicilio de la publicación, imprenta y distribución: Av. Héroe de Nacozari sur núm. 2301, acceso 11, PB, Fracc. Jardines del Parque, CP 20276, Aguascalientes, Ags., México. Se permite la reproducción total o parcial del material incluido en el Boletín sujeto a citar la fuente. Esta publicación consta de 2 500 ejemplares y se terminó de imprimir en julio de 2009. Disponible en: http://www.inegi.org.mx

Impreso en México

Dr. Víctor Manuel Guerrero Guzmán

ITAM

Dr. Ignacio Méndez Ramírez

UNAM

Dr. Jorge Eduardo Mendoza Cota

COLEF

Dr. Héctor Mendoza Vargas

UNAM

M. en C. Alejandro Mina Valdés

El Colegio de México Dr. Efrén Parada Arias

IPN

Dr. Eduardo Rodríguez Oreggia

ITESM

Dr. Pablo Ruiz Nápoles

UNAM

Fís. Juan Tonda Mazón

UNAM

Dr. José Francisco Valdés Galicia

Editor

DR © 2009,

Vol. 2, núm. 2

UNAM

Anita Estela Lozano Hube*

Los temas y usos de los catálogos son diversos; cualquier manual que se intente hacer para ello tropezará al tratar de definir en forma precisa qué se debe tener en cuenta para realizar la clasificación. En este documento se hacen sugerencias en forma general y se explican por medio de ejemplos de casos reales y bien documentados. Palabras clave: catálogo, clasificador, definición de conceptos, homologación.

Introducción La elaboración de catálogos es una actividad de gran importancia a la cual muchas veces no se le concede la adecuada atención. Se debe considerar que un buen catálogo podría ser, al mismo tiempo, un clasificador, no tratar de hacer una lista con un cierto orden de los elementos para conocer sólo su existencia, sino diseñarlo para más de un fin; por ejemplo, si se trata del catálogo de los productos de una empresa, por lo menos que permita ubicarlos en el almacén con su respectivo precio o costo o para darlos a conocer por grupos según el tipo de personas o empresas a los que se ofrecen, facilitando la forma de búsqueda para encontrar los apropiados. Igualmente, los catálogos de uso nacional o internacional tienen que elaborarse tomando en cuenta los diferentes niveles de usuarios y la utilidad que puedan tener. Por esta razón, los nombres de los elementos clasificados están siempre asociados a una clave, cuyos componentes deben tener un significado que se adapte al fin que se le vaya a dar al catálogo. * Maestra en Estadística. Coordinadora de Clasificaciones en la Dirección General de Contabilidad Nacional y Estadísticas Económicas del Instituto Nacional de Estadística y Geografía (INEGI). Teléfonos: (449) 910 44 47 (directo) y 910 44 00, ext. 4516; fax: (449) 910 44 81; correo electrónico: [email protected]

3

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Análisis para elaborar un catálogo

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Cabe anotar que para hacer algunas modificaciones a los catálogos internacionales, los expertos realizan análisis individuales, confrontan y logran el consenso entre estas opiniones, hacen conocer el proyecto y sus avances a todos los posibles usuarios vía Internet para darles oportunidad de emitir sus opiniones; además, tienen reuniones de comités y con usuarios durante, aproximadamente, cuatro o cinco años. Esto se hace para satisfacer la necesidad de actualizaciones de definiciones conceptuales y los requerimientos de clases nuevas o específicas de los países involucrados, así como para proveer de datos al Sistema de Información Estadística Internacional (Global Statistical System1), lo cual se requiere con el fin de tener información que sirva de base en la elaboración de diversos tipos de programas. Cada nación, estado, municipio o empresa que necesita un catálogo para realizar una actividad de tipo estadístico o administrativo debe seguir pasos similares a los que se llevan a cabo en los comités internacionales y nacionales, ya que sus necesidades y objetivos pueden expresarse en un marco general, en la escala correspondiente. El artículo tiene el objetivo de dar a conocer, en forma sencilla, las bases en las que debe descansar un catálogo con fines estadísticos o administrativos y los pasos a seguir durante su elaboración para tener, finalmente, un instrumento que presente todos los elementos que se considera catalogar y, además, permita realizar las clasificaciones que el tema (o temas) involucrado requiera para que los datos, estadísticas o análisis que se generen al utilizarlo cumplan con los requerimientos de información más actualizados.

Pasos a seguir Cada paso consiste en dar respuesta a una de las siguientes preguntas2 : 1. ¿Para qué va a servir? (elementos a listar, objetivos). 2. ¿Quiénes y cómo van a usar el catálogo en el manejo intermedio de la información y qué requerimientos tiene ese o esos usuarios intermedios? (responsables y técnicos, así como las condiciones para el manejo de los datos que se capten con el catálogo). Sistema de cuyo avance se responsabiliza la División de Estadística de Naciones Unidas, instancia que también compila y disemina información estadística global, desarrolla estándares para las actividades estadísticas y apoya los esfuerzos de los países para fortalecer sus sistemas nacionales de estadística. Cfr. http.unstats.un.org 2 Eivind Hoffmann, Mary Chamie. Standard Statistical Classifications: Basic Principles. Bureau of Statistics International Laborer Office. United Nations Statistics Division, en: Unstate.un.org/class/family/bestprac.pdf 1

4

Objetivo de un catálogo y participantes Su determinación requiere que, en primer lugar, se tenga una definición conceptual del catálogo a elaborar y precisar el tipo de personas, dependencias o instituciones que deban participar en el desarrollo de ideas generales de qué se desea obtener. A partir de aquí, se debe establecer, en forma conjunta, el objetivo en el cual se especifique el conjunto de elementos que se deben listar y clasificar, con una relación de los problemas que se tratan de evitar o los beneficios que se buscan y cuáles son los usos que se espera darle. El objetivo así definido será la base conceptual para decidir cómo y con qué criterios se realizará la catalogación. Para definir las facilidades o conveniencias que el catálogo va a ofrecer, tienen que participar tanto los responsables de su generación —especialistas en el(los) tema(s) y personas con conocimientos de Informática4 — como los posibles futuros usuarios. Generalmente, el número de elementos del conjunto va a crecer en la medida que se avance en las especificaciones. A veces, la elaboración de un catálogo empieza con la definición de sus componentes, sin existir aún una lista de ellos; una de las tareas es irlos describiendo conforme los participantes adelantan en el análisis, que puede ser tan simple o tan complejo como se requiera, de acuerdo con lo intrincado del conjunto a catalogar, así como de los usos que se le darán.

Dependiendo del objetivo y del conjunto de usuarios puede requerirse considerar periodos en que se actualizará, así como organizar formas de difusión. 4 Porque las claves que éste genere van a ser manejadas en sistemas informáticos. 3

5

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

3. ¿Quiénes son y cómo van a usar el catálogo, los usuarios finales y qué requerimientos tienen ese o esos usuarios finales? (usuarios y objetivos particulares). 4. ¿Con cuáles otros elementos del sistema estadístico, de la empresa o de la administración están relacionados esos requerimientos y conceptos? (relaciones estadísticas o administrativas). 5. ¿Cuáles son las definiciones conceptuales que se deben satisfacer y cómo se reflejarán éstas en el catálogo por medio de la clasificación que éste ofrecerá a los usuarios? (determinación de clases y su organización, definición conceptual de cada clase). 6. ¿Cómo se debe facilitar el manejo del catálogo por sus usuarios?, ¿habrá necesidad de capacitar a algunos en particular? (mecanismos de apoyo a usuarios). 3

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Por ejemplo, cuando se definió el conjunto a catalogar como Las plantas que se utilizan en México y sus productos en actividades primarias, en el inicio se contaba con las especies y los productos reportados en el Censo Agropecuario inmediato anterior, unidos a los de la Secretaría de Agricultura, Ganadería, Desarrollo Rural, Pesca y Alimentación (SAGARPA), que eran poco más de 400; pero, poco a poco, las dependencias públicas involucradas, así como sus oficinas estatales y los propios gobiernos de las entidades fueron reportando otros. En la actualidad, el catálogo tiene 11 500 productos y especies que satisfacen la necesidad de análisis de los usuarios, la cual expresaron al solicitar se agregaran nuevos. ¿Cómo son físicamente?, ¿en qué se usan?, ¿qué partes se utilizan?, ¿dónde se producen?, ¿con qué otros nombres se conocen?, ¿dónde se usan esos nombres?, ¿cuáles se pueden reportar agrupados? En este primer paso no se define aún el criterio de clasificación, sólo se tiene el(los) objetivo(s) que deben satisfacer el orden. La mayoría de los catálogos inicia con un conjunto de elementos preexistentes a los que se les da un orden o clasificación, por medio de reglas (sobre cómo y con qué criterios se hará la clavificación), escritas, consensuadas y dadas a conocer a todos los participantes y a los futuros usuarios, orden que se expresará a través de las claves que forman parte del catálogo. En el Catálogo único homologado de claves asignadas a las entidades federativas, municipios y localidades5, los elementos preexistentes eran: •



Un catálogo de localidades generado con el apoyo de las autoridades, sobre todo las municipales, previo al primer censo de población efectuado en 1895 (necesario para saber dónde se iba a realizar el levantamiento), el cual fue creciendo a lo largo de la historia censal y que se fue mejorando por medio de los trabajos correspondientes a los censos y de reglas sujetas a ajustes para lograr mejores resultados en cada decenio. Una cartografía en la que se habían representado divisiones geográficas cercanas a los límites municipales descritos en documentos legales y, también, divisiones al interior de los municipios, a las que se llamó áreas geoestadísticas básicas (AGEB), configuradas a partir de reglas que consideraban los requerimientos de los tres censos nacionales: de población y vivienda, económicos y agropecuario realizados entre 1980 y 1981.

INEGI, en: www.inegi.org.mx/est/contenidos/espanol/metodologías/clasificadores/Mestados.asp?5=est&c=11696

5

6



Las listas de localidades que, de acuerdo con la cartografía, había en cada AGEB y, para el caso de las localidades urbanas, la lista de las AGEB que se habían dibujado en cada una de ellas. Los reportes existentes sobre problemas encontrados en el uso de dichos elementos durante los primeros censos llevados a cabo con estos apoyos, así como los referentes a los usos que ya se habían realizado, distintos a los censales.

De las pruebas hechas para usar estos elementos con el fin de facilitar el análisis conjunto de información proveniente de las distintas dependencias que participan en los entonces Sistemas Nacionales Estadísticos y de Información Geográfica (SNEIG)6, se vio la necesidad de realizar una homologación de localidades. En la siguiente parte de este ejemplo, se puede observar que se determina de forma clara cuáles dependencias son las que participan en la definición del objetivo y en las demás tareas de la elaboración del catálogo y cómo se debe considerar la opinión de todos los usuarios: “Que esta norma fue desarrollada coordinadamente por el INEGI y las secretarías de7 Educación Pública, de Salud y de Desarrollo Social. Que el Comité Técnico Consultivo de Información Geográfica, opinó favorablemente las presentes normas, las cuales serán las mínimas que deberán observarse en todas las actividades de Homologación de Claves asignadas a las Entidades Federativas, Municipios y Localidades que se realicen directamente, o a través de terceros, por parte de las UPI que integran los SNEIG, para obtener resultados homologados y de calidad compatibles para su integración.” Debe aclararse que antes de aprobar la norma, ésta se dio a conocer durante 90 días en Internet para que los usuarios dieran sus opiniones sobre ella y se hicieran los ajustes necesarios. Enseguida, puede observarse cómo queda expresado uno o varios objetivos, los cuales detallan perfectamente el contenido del catálogo, a partir de qué elementos básicos se construirá, quiénes serán los responsables y quiénes participarán en su elaboración; además, se expresa en forma clara por qué se necesita y para qué servirá la catalogación: Hoy Sistema Nacional de Información Estadística y Geográfica por decreto presidencial, publicado en el Diario Oficial de la Federación el 16 de abril de 2008. 7 Secretaría de Hacienda y Crédito Público/Instituto Nacional de Estadística, Geografía e Informática. Norma técnica NTG004-2005. Criterios para la homologación de claves asignadas a las entidades, municipios y localidades para integrar el catálogo único homologado en esta materia, en: http:// mapserver.inegi.org.mx/mgn2k/?s=geo&c=1223; en esquina superior izquierda pedir Norma Técnica. 6

7

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009



Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

“Que el MGN está conformado por Áreas Geoestadísticas divididas en tres niveles de desagregación, Estatales, Municipales y Básicas, las cuales son fundamentales para la organización nacional, también consideradas como un insumo básico para la integración, desarrollo y explotación de los Sistemas Nacionales Estadístico y de Información Geográfica (SNEIG).

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

“Que, para lograr un manejo uniforme de las Áreas Geoestadísticas, resulta necesario uniformar los criterios utilizados para la asignación de claves de entidades federativas, municipios y localidades, con el fin de homologar los catálogos con los que cuentan las diferentes dependencias públicas de los tres niveles de gobierno y con ello, conformar el catálogo nacional correspondiente. “Que, una vez conformado el Catálogo Nacional, el INEGI, como unidad coordinadora de los SNEIG, con la participación que corresponda a las autoridades competentes, mantendrá actualizada la información relativa a las claves de entidades federativas, municipios y localidades. “Que, para la asignación y homologación de claves del catálogo, es necesario atender normas mínimas uniformes, que permitan a las dependencias realizar trabajos de actualización de la integración territorial, por lo que…” En los catálogos de uso internacional también se consideran los elementos preexistentes, para qué se quieren y cómo se va a ajustar la clasificación y a ampliar la lista, participando en el diseño un conjunto de representantes de los países, los expertos en temas específicos y un comité. Un segundo ejemplo de cómo establecer un objetivo se presenta con un catálogo internacional, que se utiliza en varias naciones para el comercio internacional y otros objetivos, el Sistema Armonizado de Codificación y Designación de Mercancías, versión 2007 (SA o HS, por sus siglas en inglés)8, cuya versión adaptada para México se expresa en la nueva Ley de Impuestos Generales de Importación y Exportación (LIGIE) 2007.9 El documento con el cual el Ejecutivo envió la propuesta de esta ley al Poder Legislativo dice: “Dado que el objetivo de esta nueva ley es actualizarla a las directrices de la Organización Mundial de Aduanas (OMA) en lo que respecta a los cambios al Sistema Armonizado de World Customs Organization. The Armonizad Comodity Description and Coding System. 2007, en: www.wcomd.org.files/1.%20Public%20files/ PDFandDocuments/Harmonized%20system/Promo%20HS%20e.pdf 9 Diario Oficial de la Federación, 18 de junio de 2007. 8

8

Codificación y Designación de Mercancías versión 2007 (SA 2007) que todos los países miembros de la OMA, incluido México están realizando, no habrá ningún impacto (…) La OMA creó el sistema armonizado por la necesidad de que existiera un criterio homogéneo para designar y clasificar las mercancías mediante una codificación uniforme a nivel mundial para todos los aspectos relacionados con el comercio exterior. Ello significa homogeneidad en la identificación de productos a nivel internacional.”

Aunque no se explica, con seguridad se disponía, también, de los reportes de resultados del uso de la versión 2002 de la Ley, entre ellos una lista de artículos detectados en las aduanas como nuevos bienes comercializados o de difícil clasificación, los cuales debían tomarse en cuenta al hacer el ajuste de la LIGIE para el 2007. Como el objetivo es actualizar la Ley de acuerdo con el SA 2007, para conocer los objetivos implícitos de la LIGIE hay que conocer los que se consideraron al elaborar el Sistema Armonizado: “–Dar un nombre único para todos los países, a cada grupo de productos que se comercializa internacionalmente. –Fijar aranceles de importación y exportación para esos grupos de productos, en cada país. –Elaborar estadísticas del Comercio Exterior de cada país, comparables entre sí. –Monitorear el movimiento de bienes controlados, como basura, narcóticos, productos químicos, especies controladas, substancias que afectan los niveles del oxígeno disponible, etc. –Generar áreas de manejo, elaborar procedimientos específicos y dar asesoría sobre riesgo, así como dar información tecnológica, relativo todo esto a bienes controlados.” En la elaboración y actualización del SA se consideraron las opiniones y necesidades de 173 países; el consenso se logró a través de dar a conocer, vía Internet, los avances de cada actualización, recibiendo opiniones de los interesados; además, se pidieron opiniones de instituciones nacionales y se realizaron reuniones periódicas o especiales, tanto de la Convención Internacional del Sistema Armonizado como dentro de un comité especial en la OMA, hasta lograr la versión definitiva a publicar; esto se realiza cada cuatro a seis años.

Todo lo anterior es la respuesta a la primera pregunta: ¿para qué va a servir el catálogo? 9

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Para este caso, los elementos preexistentes eran el catálogo de grupos de bienes expresado en la LIGIE 2002 y el catálogo de grupos de bienes expresado en el SA 2007.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Requerimientos

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Para el uso del catálogo en el manejo intermedio de la información (segunda pregunta), es necesario definir el tipo y forma de organización de las claves que se van a emplear, por lo cual hay que analizar cómo se manejarán éstas en los procesos electrónicos y cuáles condicionantes debe cumplir la clavificación para que funcionen. Hay que establecer si en las claves se aceptarán letras y signos de puntuación, además de tomar en cuenta las posibilidades de bajas y actualizaciones. Cuando las claves sirvan para manejar subgrupos, éstos podrán ser utilizados por muchos de los usuarios o por sólo unos pocos, aunque importantes; en estos casos, se debe analizar en qué nivel de la clave se formarán los nuevos subgrupos: cuando se van a utilizar por una gran cantidad de personas, conviene añadir los subgrupos en el nivel donde se presenta el requerimiento; si son pocos, pueden abrirse subgrupos en el nivel inmediato inferior. Siguiendo con el ejemplo anterior, para aplicar la LIGIE se deben seguir las reglas dadas para el uso del SA, las cuales se dan a conocer a todos los posibles usuarios, en este caso poniéndolas en Internet, como10: “…2 (b) Cualquier referencia a un material o substancia en un encabezado debe ser considerada como que incluye una referencia a mezclas o combinaciones de ese material o substancia con otros materiales o substancias. Cualquier referencia a mercancías de un material o substancias dados debe ser considerada (…) La clasificación de bienes consistentes de más de un material o substancia debe realizarse de acuerdo a los principios de la Regla 3. 3. Cuando por aplicación de la regla 2 (b) o por cualquier otra razón, las mercancías son, Prima facte, clasificables en dos o más encabezados, la clasificación se efectuará como sigue: (a) El encabezado que dé una descripción más detallada será preferido a otros que provean una descripción más general. Sin embargo, cuando dos o más encabezados se refieran cada uno a una parte solamente de los materiales o substancias contenidos…” Para realizar las actividades correspondientes a la catalogación o clasificación, debe establecerse un método, el cual se puede ejemplificar con el Catálogo único homologado de claves asignadas a las entidades federativas, municipios y localidades, descrito en la norma técnica NTG004_2005, algunos de cuyos párrafos referentes a este método se presentan a continuación: 10

Reglas generales para la interpretación del Sistema Armonizado. Nomenclatura // Nomenclatura del SA // Nomenclatura del SA 2007 Edition, en: www. wcoomd.org/home_wco_topics_hsoverviewboxes.htm

10











En el Catálogo Único, la Entidad Federativa, se representará asignándole una clave consecutiva formada por dos dígitos, de acuerdo con su nombre oficial y en orden alfabético. La clave de los municipios, estará formada por tres dígitos, se asigna de forma consecutiva de manera ascendente a partir del 001, de acuerdo al orden alfabético (…) al crearse nuevos municipios (o delegaciones para el caso del Distrito Federal), el procedimiento será el siguiente: - Se les asignará la clave consecutiva a la última registrada en la entidad; cuando… La clave de localidad, estará formada por cuatro dígitos y la asignación se puede presentar en dos momentos: - Primero, cuando se crea un municipio, en este caso la clave se asignará en forma consecutiva de manera ascendente por municipio, a partir del 0001 para la cabecera municipal, para el resto de las localidades se ordenará de manera alfabética,… - Segundo, asignación de claves dentro de un municipio, durante los procesos de actualización cartográfica, cuando se detecta la existencia de una nueva localidad, en este caso se asignará la clave consecutiva a la última registrada en el municipio. (…) …Cuando por algún movimiento de actualización se produzca la baja de alguna clave, ésta no se volverá a utilizar.”

Como puede observarse, previo al inicio de la elaboración del catálogo, se definieron las reglas de clasificación y se tomaron en consideración tanto la posibilidad de crecimiento de éste como la de bajas. Asimismo, en el proceso para desarrollar un catálogo hay que tomar en cuenta si se va a necesitar realizar operaciones aritméticas (sumas o multiplicaciones) entre datos clasificados en diferentes clases o entre grupos de ellas o si se harán operaciones lógicas (comparaciones entre diversos periodos de aplicación del catálogo o entre aplicaciones de diferentes usuarios). También, hay que considerar la posibilidad de requerir comparaciones con otras clasificaciones de la empresa, el país o internacionales. Algunos requerimientos de comparaciones van a exigir la elaboración de tablas comparativas, auxiliares del catálogo. Por ejemplo, el SA presenta como tablas auxiliares las comparativas 2007-2002 y 2002-2007 (ver tabla 1). 11

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

5.2. Criterios para asignar claves definitivas al Catálogo Único

Boletín del Sistema Nacional de Información Estadística y Geográfica

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Tabla 1

Vol. 2, núm. 2

Correlación entre la versión 2007 y la 2002 del Sistema Armonizado

Versión 2007

Versión 2002

Consideraciones

0105.94

0105.92 0105.93

Los subencabezados 0105.92 y 0105.93, basados en el criterio de peso, han sido unidos bajo el subencabezado 0105.94 para cubrir todas las aves de la especie Gallus domesticus.

0208.90

0208.20 0208.90

Se eliminó el subencabezado 0208.20 debido al bajo volumen de comercio.

0301.94 0301.95 0301.99

ex0301.99 ex0301.99 ex0301.99

Creación de nuevos subencabezados 0301.94 y 0310.95 para los atunes de aleta azul (Thunnus thynnus) y los atunes de aleta azul del sur (Thunnus maccoyii).

Un segundo ejemplo lo constituye la tabla comparativa que presenta la Organización de las Naciones Unidas (ONU) del SA 2002 y la Clasificación Central de Productos (CPC) ver. 1.1 (ver tabla 2) que presenta las relaciones entre las clasificaciones seleccionadas. En caso de una relación parcial, la columna Detalle especifica la porción de la segunda clasificación. Un ícono en la columna final significa comentarios, como cambios después de la publicación original. Tabla 2

SA 2002

Correspondencia entre SA 2002 y CPC ver. 1.1 CPC, ver. 1.1

Parte

0101.10

02113

*

0101.90

02113

*

0102.10

02111

*

0102.90

02111

*

0103.10

02121

*

0103.91

02121

*

0103.92

02121

*

0104.10

02112

*

Detalle

Nota: en el primer renglón se indica que sólo una parte de la clase 02113 de la CPC ver 1.1 corresponde a la clase 0101.10 de la SA 2002; el llamado a las definiciones tiene efecto en el documento original en Internet.

Cubrir los requerimientos para la elaboración de un catálogo parece algo que aparentemente concierne, sobre todo, a los especialistas en Informática, sin embargo, deben intervenir, también, los expertos en el(los) tema(s) de que trata el catálogo, así como los usuarios, como ya se mencionó antes. Puede verse que esta actividad exige tener una visión consensuada del objetivo del catálogo y de cómo lo van a usar los diferentes usuarios. 12

Tabla 3 Entidad

Municipio

Localidad

Nombre

Ámbito

Latitud

Longitud

Altitud

Carta

11

001

0012

Alto de San José de González

R

20°34’40”

101°32’06”

1 700

F14C62

11

001

0014

Berumbo

R

20°21’04”

101°37’59”

1 690

F14C72

11

001

0015

Boquillas

R

20°24’58”

101°25’56”

1 720

F14C72

11

001

0016

La Brisa

R

20°26’27”

101°23’23”

1 710

F14C72

Nota: en algunos casos se eliminan los ceros de la izquierda en las claves de municipios y localidades para mejor presentación.

Las comparaciones con otras clasificaciones se plantearon con el fin de homologar los catálogos con los que cuentan las diferentes dependencias públicas de los tres niveles de gobierno. Por otro lado, las listas previas de localidades indicaban que había municipios que tenían más de cien poblaciones y la necesidad de hacer comparaciones a través del tiempo hizo notar que, cuando una localidad o un municipio desapareciese, debía guardarse su información como dato histórico con el fin de realizar estudios históricos, por lo que su clave no debe volver a usarse para un elemento nuevo.

11

Consultar www.inegi.org.mx/inegi/default.aspx/Aspectos metodologicos/Consulta de clasificadores y catalogos/Geograficos/Catalogo de entidades federativas, municipios y localidades.

13

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

En el ejemplo del Catálogo único homologado de claves asignadas a las entidades federativas, municipios y localidades —utilizado al menos por las secretarías de Salud, Educación y Desarrollo Social, además del INEGI— se comprende que éstas requieren sumar los elementos que asocien al catálogo para saber qué hay o qué sucede en los municipios, en las entidades federativas y en el total del país, además de realizar las comparaciones que necesiten en el cumplimiento de sus funciones; por lo tanto, es indispensable que la clave de cada localidad esté asociada a la del municipio y a la de la entidad; y las claves de las AGEB, mencionadas en los motivos con que el Ejecutivo envió la propuesta al Legislativo, también deben estar asociadas a ellas para permitir las sumas y comparaciones dentro y entre municipios, etcétera. Así, en la tabla 3 se ve cómo se presentan las localidades en Internet.11

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Como resultado de estos análisis, se decidió que la clave de una localidad se compusiese de cuatro dígitos en total, para dar posibilidad, a través de los años, de bajas y actualizaciones. En el caso de los municipios, su desaparición o aparición es mucho más lenta y siendo menor de 600 el máximo actual por entidad, con tres dígitos bastaría.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Para las sumas y comparaciones, la clave de localidad está asociada al municipio y a la entidad, así, la clave real de cada población consta de nueve dígitos: dos para la entidad, tres para el municipio y cuatro de la localidad, colocados en ese orden. En síntesis, para realizar operaciones aritméticas y comparaciones entre cada una de las variables que se clasifiquen geográficamente, el requerimiento principal es garantizar que en cada variable se use una misma unidad de medida en cada grupo de la clasificación.

Usuarios y sus requerimientos Es muy importante saber quiénes van a utilizar el catálogo (pregunta 3), ya que sus opiniones son muy importantes para que satisfagan realmente lo que esperan de él. Algunos usuarios son dependencias gubernamentales de diversos niveles de gobierno, otros son instituciones internacionales; además, es probable que haya interesados entre la población en general, o en empresas, dependiendo del tipo y tema del catálogo a construir y de sus alcances. Como la elaboración o actualización de un catálogo debe ser un trabajo de común acuerdo, el seleccionar lo mejor posible a estos usuarios permite poder planear cómo llegar a ellos, determinar cuáles son los de mayor trascendencia, cómo pedir y recibir sus opiniones, ponerse en contacto con ellos para discutir y consensuar los planes de trabajo, realizar la clasificación en sí misma, afinar cuáles son los usos principales, etcétera. En esta parte del proceso también entran las actividades relacionadas con la verificación de qué otros elementos del sistema estadístico, de la empresa o de la administración se relacionan con esos requerimientos y conceptos (pregunta 4). No debe olvidarse revisar si existen catálogos para el mismo tema o un tema relacionado, para efectos de comparación, a nivel nacional, internacional o empresarial, según el caso, ya que deberá investigarse quiénes son los responsables, los generadores y los usuarios, a los cuales también se les consultará. 14

Por ejemplo, una empresa que va a elaborar un catálogo de bienes debe analizar si la nómina, ya existente y que en sí misma es un catálogo, debe o no estar relacionada con el catálogo de bienes; al ver la posibilidad de que se requiriese saber quiénes son los responsables de éstos o si un bien se está o no ocupando en la actividad o niveles para los cuales se destinó, implicará que en ambos catálogos tiene que existir en la clave un elemento común que permita relacionarlos.

Tabla 4

Correspondencia entre CPC ver. 1.1 y SA 2002

CPC ver. 1.1

SA 2002

01110

1001.10 1001.90

01120

1005.10 1005.90

01130

1006.10

01140

1006.20

01150

1003.00

01160

1002.00 1004.00

01190

1007.00 1008.10 1008.20 1008.30 1008.90

Parte

Detalle

Una vez determinados los usuarios y después de tener una reunión con los más representativos para saber sus requerimientos y cómo participarán en la construcción y en los usos del catálogo, es conveniente elaborar, en forma conjunta, una ruta de trabajo que sea aprobada en primera instancia, además de una visualización de cómo será el catálogo en cuanto a clasificación y definiciones, para presentar esto a un público más extenso con lo cual se realizarán los estira y afloja entre requerimientos y posibilidades hasta tener el catálogo final, siempre por el método de analizar entre todos y consensuar. Economical and Social Statistical Classifications. Available correspondences. Correspondence between CPC ver.1.1 and HS 2002, en: http://unstats. un.org/unsd/cr/registry/regso.asp?Ci=20&Lg=1

12

15

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Otro caso es el del catálogo internacional CPC, el cual muestra los grupos principales de productos de las actividades económicas; tiene relación con el SA, por lo que se presenta con la tabla comparativa, la cual es consultada no sólo durante la vigencia del clasificador CPC ver. 1.1 sino, también, al elaborar la siguiente versión (ver tabla 4).12

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Es necesario que toda la información recopilada o generada durante las actividades mencionadas en los párrafos anteriores se encuentre en documentos, de preferencia cuadros sinópticos, que puedan ser consultados fácilmente por todos los participantes y usuarios ya que servirán de pauta para la determinación de las clases y la elaboración del catálogo. Entre ellos, es conveniente que esté:

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009



La definición precisa de los elementos del catálogo a generar que, en caso de uno de productos del sector primario, puede ser: - Especies y productos agropecuarios forestales y pesqueros utilizados en México, o bien, especies y productos agropecuarios, forestales y pesqueros producidos en México. Estas definiciones abarcan universos diferentes ya que no todo lo que se usa en México es producido ahí mismo. • Las listas o catálogos previos, si es que existen, con las definiciones y clasificaciones que tengan. Por ejemplo, en la homologación de catálogos de localidades, las listas de localidades generadas en actividades propias de las dependencias participantes. Esta parte es vital por la alta probabilidad de que nombres que están en una de las listas correspondan realmente a nombres distintos en otra de ellas, por lo cual su análisis y homologación cuidadosa son muy importantes para lograr calidad en el catálogo y en las listas comparativas presentadas a los usuarios. Siguiendo con el ejemplo de localidades, hay muchas que se conocen con nombres distintos (tal vez porque han cambiado o por costumbres locales) por lo que la verificación en el sitio se hace a veces indispensable. • Una lista de los diferentes temas propuestos como clasificadores, que contenga quién los propuso y el(los) objetivo(s) particular(es). Por ejemplo, para el Catálogo de especies y productos agropecuarios, forestales y pesqueros utilizados en México (CEPAFOP) se solicitaron, entre otros, varios temas (ver tabla 5). Tabla 5

Usuario

Contabilidad nacional

Temas propuestos para el CEPAFOP Tema 1 Actividad

Continúa

Objetivo particular

Clasificaciones estadísticas

Contabilidad nacional

Tiempo en tierra (veget.)

Cálculos

Contabilidad nacional

Función de producción

Clasificaciones estadísticas

Contabilidad nacional

Grupo vegetal

Clasificaciones estadísticas

Contabilidad nacional

Función de animales

Clasificaciones estadísticas

Contabilidad nacional

Dio lista de especies importantes

Cálculos

16

Tabla 5

Concluye

Temas propuestos para el CEPAFOP Tema 1

Objetivo particular

Censo Agropecuario

Actividad (según SCIAN)

Clasificaciones estadísticas

Censo Agropecuario

Tiempo en tierra (veget.)

Clasificaciones estadísticas

Censo Agropecuario

Función de producción

Clasificaciones estadísticas

Censo Agropecuario

Parte cosechada (veget.)

Clasificaciones estadísticas

Censo Agropecuario

Especie animal

Clasificaciones estadísticas

Censo Agropecuario

Grupo vegetal

Clasificaciones estadísticas

Censo Agropecuario

Uso

Clasificaciones estadísticas

Censo Agropecuario

Destino/Producción

Clasificaciones estadísticas

SAGARPA

Relación con FAO

Clasificaciones estadísticas

SAGARPA

Grupo vegetal

Clasificaciones estadísticas

SAGARPA

Actividad

Clasificaciones estadísticas

SAGARPA

Tiempo en tierra (veget.)

Clasificaciones estadísticas

SAGARPA

Uso

Clasificaciones estadísticas

SAGARPA

Variedad comercial vegetal

Clasificaciones estadísticas

SAGARPA

Función de producción

Clasificaciones estadísticas

SAGARPA

Destino/Producción

Clasificaciones estadísticas

SAGARPA

Especie animal

Clasificaciones estadísticas

SAGARPA

Función de animales

Clasificaciones estadísticas

SAGARPA

Edad animales

Cálculos y clasificaciones estadísticas

SAGARPA, CONAPESCA

Zona de pesca

Reportes a FAO

Economía

Grupo vegetal

Clasificaciones estadísticas

Economía

Destino/Producción

Cálculos comparativos

Economía

Variedades comerciales

Cálculos y clasificaciones estadísticas

Economía

Calidad del producto

Cálculos y clasificaciones estadísticas

SAT

Partida arancelaria

Control de aduanas

SAT

Descripción de cada elemento

Apoyo a aduanas

SCT

Medio de transporte

Clasificaciones estadísticas

SCT

Destino/Producción

Clasificaciones estadísticas

SEDESOL

Especie vegetal

Apoyo a planeación y clasificaciones

SEDESOL

Destino/Producción

Apoyo a planeación y clasificaciones

SEDESOL

Especie animal

Apoyo a planeación y clasificaciones

SEDESOL

Función de animales

Apoyo a planeación y clasificaciones

SEMARNAT

Taxonomía

Clasificaciones estadísticas y reportes a FAO

SEMARNAT

Función de producción

Daños a ecología y clasificaciones

SEMARNAT

Cultivos orgánicos

Daños a ecología y clasificaciones

SEMARNAT

Mejoradores y protectores de suelos

Apoyo a ecología y clasificaciones

Nota: resultado de comunicaciones personales y reuniones del grupo de trabajo CEPAFOP del Comité Técnico de Estadística e Información Geográfica para el Desarrollo Rural Sustentable.

17

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Usuario

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Boletín del Sistema Nacional de Información Estadística y Geográfica



Vol. 2, núm. 2

En este caso, la mayoría de los objetivos apoyó la elaboración de las estadísticas respectivas, tanto las nacionales como a la contabilidad nacional, y para SAGARPA ayudó a la comparación en el ámbito internacional; para el SAT, los temas interesaron a las aduanas y agencias aduanales en la aplicación de la Ley y a SEMARNAT, para evaluar daños a la ecología. En el análisis en este ejemplo, igual se rechazan temas, como los de calidad y medio de transporte: en el primero, cada central de abastos del país define de diferente forma esta categoría en los vegetales (un aguacate de segunda en la central de la ciudad de México puede ser de primera en una del norte del país); en el segundo se da el caso de que cada producto puede tener, por lo menos, dos medios de transporte, pues eso depende, más bien, del productor y no del producto. • Un cuadro con el esquema inicial de clasificación en el que ya se consideren los temas aceptados, cuáles se concatenarán con otros para formar una sola clave, así como los diversos niveles jerárquicos que se formarán. Por ejemplo, para el mismo CEPAFOP se generó un cuadro sinóptico para vegetales (ver tabla 6). • Un directorio de participantes que contenga, tal vez, incluso los temas en que han participado durante las reuniones. • Un directorio de usuarios que contenga sus requerimientos y propuestas.

Tabla 6

Principales temas y sus desgloses, primera propuesta

18

Tipo de catálogo Vegetales

Continúa

Actividad

Función de producción

Parte cosechada o cortada

Grupo vegetal, especies

Uso

Agrícola

Anuales a cielo abierto

Semilla

Oleaginosas

Uso agrícola

Forestal

Perennes

Fruto

Leguminosas

Reforestación

No especificada

Vivero

Hoja

Gramíneas

Ornamental

Invernadero

Flor

Hortalizas

Ornamental ya plantada

Explotación forestal 10 años

Tallo

Cactáceas

Consumo humano directo

Recolección

Ramas

Agaves

Consumo animal directo

Corte a diente

Planta completa

Hongos

Especias y condimentos

Tabla 6

Principales temas y sus desgloses, primera propuesta

Tipo de catálogo

Actividad

Concluye

Función de producción

Parte cosechada o cortada

Grupo vegetal, especies

Varios

Parte aérea

Pastos

Industria de alimentos

Combinación de partes

Árboles no frutales

Industria de bebidas

Desconocido

Plantas forrajeras

Industria aceitera

Cortezas y cáscaras

Mejoradores y protectores de suelos

Industria farmacéutica

Látex

Uso

Uso medicinal

Industria textil de fibras duras Artesanías Industria de perfumería Industria de pintura y tintas Industria química Industria del papel Industria maderera Leña Carbón Control de plagas Uso doméstico Otros no especificados

Nota: puede observarse que están considerados los temas propuestos, por ejemplo, Tiempo en tierra está incluido en la Función de producción.

Definición conceptual Ésta es la parte más compleja de la elaboración de un catálogo y corresponde a la respuesta de la pregunta: ¿cuáles son las definiciones conceptuales que se deben satisfacer y cómo se reflejarán éstas en el catálogo por medio de la clasificación que éste ofrecerá a los usuarios? Para iniciar esta acción ya se debe tener el(los) tema(s); los problemas a solucionar por el catálogo o las actividades que debe apoyar; las personas que han participado o participarán en todo o parte del desarrollo; la(s) variable(s) principal(es) que se debe(n) clasificar; aquellas otras que podrían ser clasificadas con el apoyo del catálogo y un esquema consensuado de cómo será la clasificación. También, esta información estará en cuadros sinópticos que puedan ser consultados de forma fácil por todos los participantes y usuarios, ya que servirán de pauta para la determinación de las clases y de sus niveles intermedios. 19

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Industria textil de fibras blandas

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Para formalizar el trabajo, tienen que elaborarse, con todo cuidado, las definiciones teóricas de los conceptos que se están manejando, tanto de las variables que se usarán como de las clases que se van a formar y las agrupaciones de éstas; para cada concepto adicional al que se recurra (sea una variable o una clase) debe tenerse su definición para garantizar que lo incluido en cada clase o agrupación de clases sea exactamente lo que debe estar ahí y que cada elemento a clasificar pueda entrar en una y sólo una clase.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Es necesario tener en cuenta que los elementos a clasificar entrarán en una clase de acuerdo con el valor que tengan de una variable o de un conjunto de variables, lo cual tiene que definirse cuidadosamente. Por ejemplo, en un catálogo para clasificar vegetales, una de las variables con lo que se va a clasificar es el tiempo que duran en la tierra. Ésta es una definición muy general, debe aclararse si se refiere a vegetales cultivados o a vegetales en general, si se cuenta desde el momento de la siembra hasta el término del ciclo vegetativo o hasta el instante de la última cosecha económicamente aprovechable, por ejemplo, al hablar de la cebolla, si se trata del ciclo vegetativo, la planta dura dos años en la tierra, pero si se va a cosechar el bulbo, dura menos de un año, pues el agricultor la arranca. Otro caso es cuando en una clasificación se habla de la edad de una persona, hay que definir si se trata de años cumplidos o transcurridos desde el año de nacimiento, ya que si se obtuvo la información en una fecha anterior al cumpleaños o en un año posterior al del último onomástico, habrá una diferencia de un año según la definición utilizada, lo cual afecta si se van a hacer pirámides de edades con los resultados de la clasificación. Un ejemplo más de cómo presentar definiciones es la LIGIE, que muestra algo similar a notas en las secciones o en los capítulos (ver tabla 7). Otro más sobre la presentación de definiciones se encuentra en el Sistema de Clasificación Industrial de América del Norte (SCIAN), como se puede apreciar en la tabla 8. Para definir las diferentes clases y sus agrupaciones, es necesario que participen los especialistas en el(los) tema(s) y los usuarios —como ya se había mencionado—, así, en el catálogo de productos de los subsectores agrícola, ganadero, forestal y pesquero, los responsables de las estadísticas nacionales de cultivos, requieren clasificar hasta el nivel de la especie, mientras que los responsables en las entidades federativas consideran conveniente llegar a variedad, porque en sus 20

Tabla 7

Sección XV Metales comunes y manufacturas de estos metales

Tabla 8



312222



Elaboración de puros y otros productos de tabaco MÉX.



Unidades económicas dedicadas principalmente a la elaboración de puros, tabaco para mascar, tabaco rapé y para pipa.



Unidades económicas dedicadas principalmente al alquiler de automóviles sin chofer. Incluye también: u.e.d.p. al alquiler de automóviles sin chofer en combinación con el arrendamiento financiero. Excluye: u.e.d.p. al arrendamiento financiero de automóviles (522410, Arrendadoras financieras); al alquiler de automóviles con chofer (485991, Alquiler de automóviles con chofer) y al alquiler de limusinas con chofer (485320, Servicio de limusinas).



532110



Alquiler de automóviles sin chofer MÉX.

estadísticas manejan precios diferenciados; por otro lado, el responsable de las estadísticas de pesca que se envían a Naciones Unidas para elaborar los totales mundiales pide que en la clasificación se consideren las clases que define el organismo internacional que maneja la producción pesquera (FAO), más las clases que se utilizan en las aduanas para el comercio internacional (SA). Cada uno de estos requerimientos debe ser analizado por los especialistas en conjunto con los demás participantes para, de ser posible, introducirlos en el catálogo y considerarlos en la clave u ofrecer otra solución a los usuarios. Para realizar el análisis, son de gran ayuda los cuadros sinópticos generados durante las etapas previas, así, por ejemplo, a partir de los temas propuestos para el CEPAFOP, se realizaron 21

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Notas: Esta sección no comprende: a) Los colores y tintas preparados a base de polvo o escamillas metálicos, así como las hojas para el marcado a fuego (partidas 32.07 a 32.10, 32.12, 32.13 ó 32.15). b) El ferrocerio y demás aleaciones pirofóricas (partida 36.06). c) Los cascos y demás tocados, y sus partes, metálicos (partidas 65.06 y 65.07). d) Las monturas de paraguas y demás artículos (partida 66.03). e) Los productos del Capítulo 71, por ejemplo: aleaciones de metal precioso, metal común chapado de metal precioso (plaqué), bisutería. f) Los artículos de la Sección XVI (máquinas y aparatos, material eléctrico).

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

diversos cuadros con propuestas de clasificación. Primero se observó el número de instituciones o dependencias que pedían un tema, para ordenarlos por importancia; luego se vio si se podían formar grupos y subgrupos utilizando dichos temas y se separaron porque, aun cuando son necesarios para varias instituciones, integrarlos en una clasificación con los otros implicaría generar un número inmanejable de clases y alargar demasiado la clave (ver tabla 9). Tabla 9

Temas propuestos para el CEPAFOP

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Temas concatenables: Actividad, parte usada, uso, especie y variedad, orgánico o no. Temas que se podrían manejar por separado: Se decidió que las variedades de cultivos y el ser orgánicos o no, así como las especies forestales se integrasen a la clave en tal forma que pudiera dejar de considerar esas características cuando la estadística a generar así lo requiera; para las clasificaciones internacionales o nacionales pedidas, se determinó integrarlas al catálogo pero no a la clave, así, el catálogo, en su versión para Internet, quedó como sigue:

Fruto

Parte usada

Función de actividad

Subactividad

Ciclo vegetativo

Clima

Anual

Cálido

Unidad de medida

Cosecha en un año o menos, a cielo abierto

Agrícola

Fruto

Invernadero

Agrícola

Anual

Cálido

Tonelada

Planta

Invernadero

Agrícola

Anual

Cálido

Charola

Semilla

Cosecha en un año o menos, a cielo abierto

Agrícola

Anual

Cálido

Kilo

Producto obtenido y uso: Parte usada

Uso

Img

Clave INEGI

Tonelada

Clave Clave Clave Clave Clave Clave armoniFAOSTAT SCIAN SEMARNAT CPC FAO zada

Planta

Agrícola

Img

2148105001

1293

111249

01510

16230

0602.90.99

Semilla

Agrícola

Img

2111105001

1294

111219

01540

18600

1209.99.02

Semilla

Artesanal

Img

2111105001

1294

111214

01990

15211

1404.90.99

Fruto

Consumo humano

2142105001

0567

111421

01349

15211

0807.11.01

Fruto orgánico

Consumo humano

2112105401

0567

111214

01349

15211

0807.11.01

Nota: la clave INEGI expresa datos sobre actividad principal, tiempo en tierra, función de actividad, parte usada, cultivo orgánico o no, semilla para siembra, especie y variedad; los demás temas se presentan por separado, para satisfacer todos los requerimientos.

22

Una vez tomadas las decisiones a nivel tema, es necesario determinar los desgloses requeridos para satisfacer las necesidades expresadas por participantes y usuarios. Para ello, se usan las propuestas que ya se hicieron y las que analizarán los especialistas junto con los participantes y usuarios para ajustarlas hasta verificar, uno, que no haya intersecciones —y que el conjunto de clases formadas cubra el universo— y, dos, se satisfagan las necesidades para las que se elabora el catálogo.

Al consultar a un especialista en Educación, se modificaron las clases para clarificar y abarcar el universo, satisfaciendo las condiciones propias de la empresa, por lo cual, finalmente, quedaron: Doctorado, Maestría, Ingeniería, Otras licenciaturas, Técnico superior universitario, Profesional técnico bachiller, Bachillerato con estudios técnicos o comerciales, Bachillerato sin estudios técnicos o comerciales, Secundaria con estudios técnicos o comerciales, Secundaria sin estudios técnicos o comerciales y Otro tipo de capacitación. Para cada clase se elaboraron definiciones, entre ellas: •



Técnico superior universitario: quien terminó su bachillerato con o sin estudios técnicos y realizó estudios de nivel superior; cumplió con su servicio social y las prácticas profesionales; realizó cursos de titulación, tesina o tesis y examen profesional para obtener el título de técnico superior. Profesional técnico bachiller: quien terminó el bachillerato con estudios técnicos o comerciales, realizó el servicio social y las prácticas profesionales y se tituló por promedio o hizo tesis y examen profesional para obtener el título de profesional técnico.

Una vez que se tienen las clases y sus definiciones, se procede a asignar la clave que corresponde a cada clase siguiendo, para ello, el orden que se estableció al determinar las agrupaciones que se deben realizar. Siguiendo con el caso de la escolaridad de los trabajadores, una agrupación es por nivel de estudio, quedando la clavificación como sigue: 10 Nivel posgrado 11 Doctorado 12 Maestría 23

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Por ejemplo: en una empresa, el gerente piensa ofrecer emolumentos apropiados a los conocimientos de sus trabajadores por lo que requiere un catálogo de niveles de estudio. En las primeras etapas de la elaboración se propusieron las siguientes clases: Doctorado, Maestría, Especialidad, Licenciatura, Carreras técnicas, Bachillerato, Secundaria y Otro tipo de capacitación.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

20 Nivel superior 21 Ingeniería 22 Otras licenciaturas 23 Técnico superior universitario 30 Nivel bachillerato 31 Profesional técnico bachiller 32 Bachillerato con estudios técnicos o comerciales 33 Bachillerato sin estudios técnicos o comerciales 40 Nivel secundaria 41 Secundaria con estudios técnicos o comerciales 42 Secundaria sin estudios técnicos o comerciales 50 Otros 51 Otro tipo de capacitación El ejemplo es muy sencillo, aunque se presta para más complejidades, pues si se requiriese manejar también el tipo de tecnología o especialidad que estudiaron los empleados, se clavificaría en el siguiente dígito o par de ellos, según el número de desgloses requeridos en cada nivel, de donde el gerente (con los especialistas) podría elegir las que corresponden a actividades que se desarrollan en su empresa: 31 Profesional técnico bachiller 3111 En metal mecánica 3112 En mecánica automotriz Etcétera Considérese que basta que un grupo requiera dos dígitos para su desglose para que sea necesario asignar esos mismos dos dígitos para todos los demás grupos de ese nivel, aunque en los demás sólo se usen dos o tres combinaciones, por ejemplo: 01, 02 y 03. Esto se puede ejemplificar con el catálogo del SA (expresado en México en la LIGIE, en la sección I, capítulo 01 de animales vivos), como se muestra en la tabla 10. Sin embargo, en esta misma tabla se puede observar que la pareja formada por los dígitos quinto y sexto se están usando sólo para dos o cuatro clases, pero en el capítulo 02, de carne de animales, para la de aves sí se requirieron los dos dígitos (ver tabla 11). Es conveniente formar siempre grupos de acuerdo con características que se puedan concatenar, asignando las claves también en aquellos claramente diferenciados y con holguras, lo cual permitirá, 24

en el futuro, modificar las claves de uno si éste requiere mayores desgloses, sin tener que alterar el total de la clavificación. Tabla 10

Caballos, asnos, mulos y burdéganos vivos

0101.10

-

Unidad

Importación Export.

Reproductores de raza pura

0101.10.01

Caballos

Cbza.

10

Ex.

0101.10.99

Los demás

Cbza.

20

Ex.

0101.90

-

Los demás

0101.90.01

Caballos para saltos o carreras

Cbza.

20

Ex.

0101.90.02

Caballos sin pedigree, para reproducción

Cbza.

10

Ex.

0101.90.03

Caballos para abasto, cuando la importación la realicen empacadoras tipo inspección federal

Cbza.

10

Ex.

0101.90.99

Los demás

Cbza.

20

Ex.

Cbza.

Ex.

Ex.

Cbza.

Ex.

Ex.

01.02

0102.10

Animales vivos de la especie bovina

-

Reproductores de raza pura

0102.10.01 0102.90

Reproductores de raza pura -

Los demás

0102.90.01 Nota:

Vacas lecheras

este capítulo comprende todos los animales vivos, excepto: a) Los peces, crustáceos, moluscos y demás invertebrados acuáticos, de las partidas 03.01, 03.06 ó 03.07. b) Los cultivos de microorganismos y demás productos de la partida 30.02. c) Los animales de la partida 95.08.

Tabla 11

Continúa

Ley de los Impuestos Generales de Importación y Exportación, 2007 Capítulo 02 Carne y despojos comestibles, de aves de la partida 01.05, frescos, refrigerados o congelados

02.07

0207.11

-

De gallo o gallina

--

Sin trocear, frescos o refrigerados

0207.11.01 0207.12

Sin trocear, frescos o refrigerados --

0207.12.01 0207.13

234

Ex.

Kg

234

Ex.

Sin trocear, congelados Sin trocear, congelados

--

Kg

Trozos y despojos, frescos o refrigerados

0207.13.01

Mecánicamente deshuesados

Kg

234

Ex.

0207.13.02

Carcazas

Kg

234

Ex.

25

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

01.01

Ley de los Impuestos Generales de Importación y Exportación, 2007 Capítulo 01

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Tabla 11

Concluye

Ley de los Impuestos Generales de Importación y Exportación, 2007 Capítulo 02

02.07

Carne y despojos comestibles, de aves de la partida 01.05, frescos, refrigerados o congelados

0207.13.03

Piernas, muslos o piernas unidas al muslo

Kg

234

Ex.

0207.13.99

Los demás

Kg

234

Ex.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

0207.14

--

Trozos y despojos, congelados

0207.14.01

Mecánicamente deshuesados

Kg

234

Ex.

0207.14.02

Hígados

Kg

10

Ex.

0207.14.03

Carcazas

Kg

234

Ex.

0207.14.04

Piernas, muslos o piernas unidas al muslo

Kg

234

Ex.

0207.14.99

Los demás

Kg

234

Ex.

Kg

123

Ex.

Kg

234

Ex.

Kg

234

Ex.

Kg

234

Ex.

Kg

10

Ex.

0207.24

-

De pavo (gallipavo)

--

Sin trocear, frescos o refrigerados

0207.24.01

Sin trocear, frescos o refrigerados ....

0207.27.99

0207.32

Los demás -

De pato, ganso o pintada

--

Sin trocear, frescos o refrigerados

0207.32.01 0207.33

Sin trocear, frescos o refrigerados --

0207.33.01 0207.34

Sin trocear, congelados --

0207.34.01 0207.35

Sin trocear, congelados

Hígados grasos, frescos o refrigerados Hígados grasos, frescos o refrigerados

--

Los demás, frescos o refrigerados

En el mismo ejemplo de la tabla 11 puede verse que en el grupo de Carne y despojos comestibles, de aves de la partida 01.05, frescos, refrigerados o congelados se formaron subgrupos y se les asignó el tercero y cuarto dígitos, también en subgrupos: 0201 0202 0203 0207 26

De ganado bovino De ganado porcino De ovinos y caprinos De aves

0207 0207 0207 0208

De gallo o gallina Del 0207.11 al 0207.14 De pavo Del 0207.24 al 0207.27 De pato, ganso o pintada Del 0207.32 al 0207.35 Las demás carnes y despojos comestibles, frescos, refrigerados o congelados

No se debe olvidar que definir las unidades de medida en que se expresarán los datos relativos a las variables del(los) tema(s) que maneja el catálogo es de gran importancia para asegurar que los diferentes usuarios de éste puedan realizar operaciones matemáticas con los entes catalogados, sea a través del tiempo o entre diferentes usuarios; por ejemplo, en la LIGIE, como parte inherente a ella, están las unidades de medida (ver tablas 10 y 11, donde para los animales vivos la unidad de medida es la cabeza, mientras que para su carne es el kilogramo). En el CEPAFOP, cada especie-producto tiene indicada su unidad de medida (ver tabla 12). Tabla 12

Parte usada

Sistema de consulta, CEPAFOP. Parte del reporte sobre una especie agrícola Función de actividad

Subactividad

Ciclo vegetativo

Clima

Anual

Cálido

Unidad de medida

Fruto

Cosecha en un año o menos, a cielo abierto

Agrícola

Tonelada

Fruto

Invernadero

Agrícola

Anual

Cálido

Tonelada

Planta

Invernadero

Agrícola

Anual

Cálido

Charola

Semilla

Cosecha en un año o menos, a cielo abierto

Agrícola

Anual

Cálido

Kilo

Manuales e instructivos En lo relativo a las preguntas: ¿cómo se debe facilitar el manejo del catálogo por sus usuarios? y ¿habrá necesidad de capacitar a algunos en particular?, los catálogos, como todas las demás herramientas para trabajos técnicos, van a ser utilizados por personas que no participaron directamente en su elaboración, por lo cual es necesario tomarlas en consideración y elaborar manuales bien explicados sobre cómo manejarlo, además de considerar la posibilidad de capacitaciones. 27

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Es posible observar que las aves se dividieron, a su vez, en subgrupos (diferentes especies) y que, de los dos dígitos asignados para productos (quinto y sexto) se utilizó el quinto para diferenciar estos subgrupos según la especie, dejando números intermedios para cualquier modificación dentro del subgrupo.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Cuando un catálogo tiene las definiciones bien explicadas es sencillo su uso (como en el caso del SCIAN) por lo que no requiere un manual o instructivo.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

En cuanto a la LIGIE, sus definiciones y notas con precisiones son claras y no requieren más explicaciones, siempre y cuando se tenga a la mano el texto completo de la Ley, ya que si alguien usa la definición aislada de una clase, puede no saber de qué se trata, como en el ejemplo que se muestra en la tabla 13. Un catálogo más complejo por la cantidad de temas que maneja (como el CEPAFOP) requeriría un manual de manejo y, tal vez, hasta instrucción para algunos usuarios, por lo cual se recurrió a ofrecer la base de datos que contiene la información para su manejo, combinaciones y ordenamientos según lo que requiera cada usuario técnico13; para los especialistas y manejo informático

Lozano Hube, Anita Estela. “Catálogo de especies y productos agropecuarios, forestales y pesqueros (CEPAFOP)”, en: Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica. Vol. 2, Núm. 3, septiembre-diciembre. México, INEGI, 2006, pp. 3-30.

13

Tabla 13

0103.92.99

Los demás

LIGIE, 2007 Capítulo 01

Cbza.

20

Ex.

Cbza.

Ex.

Ex.

Pero con el texto completo obtiene la siguiente información: 01.03 0103.10

Animales vivos de la especie porcina -

0103.10.01 0103.91

Reproductores de raza pura Reproductores de raza pura

-

Los demás

--

De peso inferior a 50 kg

0103.91.01

Con pedigree o certificado de alto registro

Cbza.

9

Ex.

0103.91.02

Pecarís

Cbza.

20

Ex.

Los demás

Cbza.

20

Ex.

0103.91.99 0103.92

--

De peso superior o igual a 50 kg

0103.92.01

Con pedigree o certificado de alto registro

Cbza.

9

Ex.

0103.92.02

De peso superior a 110 kg, excepto lo comprendido en las fracciones 0103.92.01 y 0103.92.03

Cbza.

20

Ex.

0103.92.03

Pecarís

Cbza.

20

Ex.

0103.92.99

Los demás

Cbza.

20

Ex.

Con esto ya se puede saber que en la clase 0103.92.99 no se deben considerar todos los animales relacionados en las clases anteriores.

28

se dispone, además, de un sistema de consulta por Internet que le facilita las cosas al usuario en general (ver imagen). Al dar posibilidades para la consulta a nivel nombre común o científico, además de consultas por clases o características, como la del ejemplo, se eliminó la necesidad de un manual.

Para los catálogos internacionales se define, también, un periodo para la presentación de la siguiente actualización, dado el número de países que están involucrados, los cuales deben modificar sus sistemas nacionales, como se hizo en México con la LIGIE al modificarse en el 2007 el SA2002. Para otro tipo de catálogos es conveniente que, entre responsables, participantes y usuarios se realice esta definición.

Sistema de consulta, CEPAFOP. Pantalla para consulta por características de especies y productos vegetales

29

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Por último, tampoco debe olvidarse elaborar un plan de trabajo para cuando se requieran hacer modificaciones al catálogo, sea porque hayan aparecido nuevos elementos del mismo tipo de los catalogados o porque se hayan generado nuevos requerimientos.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Análisis comparativo de la teoría clásica de ajustes con respecto a la teoría de valores extremos en la distribución de los máximos de los ingresos

José Luis Ángel Rodríguez Silva*

El artículo presenta un análisis de la distribución de los máximos en la distribución de los ingresos con datos tomados de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH), realizada por el Instituto Nacional de Estadística y Geografía (INEGI) en el 2004. Para ello, se hacen los ajustes correspondientes utilizando los procedimientos estándar y se comparan contra los resultados de la aplicación de la teoría de valores extremos con la finalidad de establecer un esquema comparativo de beneficios y desventajas relativas. Este problema es relevante debido a que la distribución de los ingresos presenta peculiaridades especiales, por ejemplo, la cola derecha de la distribución de los ingresos es muy pesada (lo cual imprime un grado importante de complejidad al estudio) y unos cuantos ingresos superiores tienen una contribución muy importante al total de la distribución. Palabras clave: distribución de los ingresos, ENIGH, teoría de valores extremos, distribución Gumbel, distribución Fréchet, distribución Weibull, distribución beta generalizada del segundo tipo, distribución log-normal.

* Jefe del Departamento de Proyectos Institucionales en la Dirección General de Estadísticas Sociodemográficas del INEGI. Teléfono: (449) 910 53 00, ext. 4770; correo electrónico: [email protected] Nota: este trabajo es un extracto del documento de tesis que fue generado para la obtención de grado de Maestría en Ciencias en Estadística Oficial del Centro de Investigación en Matemáticas (CIMAT), presentada el 29 de junio de 2007, en Guanajuato, Gto., México.

30

1.

Introducción



• • •



Son siempre sesgadas a la derecha, lo cual implica, en particular, que existe una gran cantidad de individuos con relativamente pocos ingresos, y un número reducido con ingresos muy altos (aunque de una gran importancia en cuanto a su aportación conjunta y relativa al ingreso total). Sus funciones de densidad son asimétricas y tienen una gran cola derecha (lo cual se manifiesta diciendo que tienen colas pesadas). Tienen medidas positivas de sesgo (tercer momento alrededor de la media). Las funciones de densidad también son leptocúrticas (cuarto momento positivo alrededor de la media); esto significa, en general, que el grado en que se manifiesta el pico de este tipo de distribuciones es más fuerte que el de una normal asociada. Como ya se había comentado, las funciones de densidad tienen también una cola pesada, esto es, la media de los ingresos excede a su mediana y los cuantiles superiores tienen una participación desproporcionadamente grande del total de los ingresos.

Cabe señalar que Pareto (1897) y Bowley (1915) fueron los pioneros en estudiar la distribución de los ingresos personales desde un punto de vista empírico. A pesar de tales esfuerzos, el problema de la identificación de una estructura distribucional para los ingresos no es en absoluto trivial. Por ejemplo, en México, los ingresos difieren fuertemente en las diversas categorías de agrupación, como: tipo de trabajo, experiencia laboral, edad, sexo, zonas de residencia (urbana, rural, semi-rural, etcétera). A su vez, debido a que los datos asociados casi siempre son obtenidos mediante un proceso de muestreo, también debe tener en cuenta su error asociado. Una tercera consideración surge al 31

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Las teorías de las distribuciones de los ingresos siempre han tenido fuertes motivaciones empíricas. Así, los primeros estudios acerca de la riqueza y el ingreso descubrieron una regularidad notable que se encuentra en todas las distribuciones conocidas de ingresos en grandes poblaciones:

Boletín del Sistema Nacional de Información Estadística y Geográfica

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

considerar la problemática de empatar los datos de los ingresos de la ENIGH con respecto a los correspondientes de las oficinas de cuentas nacionales, situación que, en sí misma, merece un estudio a profundidad. Las metodologías aplicadas al análisis de este problema cubren un amplio espectro de las cuales se pueden considerar las siguientes, entre otras: el ajuste por máxima verosimilitud a ciertas distribuciones clásicas; la imputación de datos para aquellos registros que carecen de respuesta; el uso de registros administrativos y otras fuentes de información para obtener la información asociada; el uso de herramientas de simulación (como las estrategias de bootstrap y jackniffe) y empleo de métodos intensivos por computadora para obtener información acerca de los estimadores asociados y sus errores. En este sentido, existe una rama de la estadística conocida como Teoría de valores extremos, que cuenta con poderosos mecanismos de modelación y validación para analizar aquellos hechos que podrían catalogarse como inusuales. En este trabajo se empleará esta estrategia (además de algunas otras) para analizar de forma estadística la cola derecha de la distribución de los ingresos en México (que, por poseer ciertas características que serán analizadas después, sus valores pueden catalogarse como extremos). Así, el propósito fundamental que tiene el presente estudio es llevar a cabo un análisis comparativo del nivel de ajuste de la cola derecha de la distribución de ingresos mediante el uso de la distribución beta generalizada del segundo tipo, la log-normal y los modelos de la teoría de valores extremos, estudio que, en principio, por la revisión de la literatura, parece ser que no ha sido llevado a cabo, al menos en México.

2.

Teoría breve de valores extremos

2.1. Formulación del modelo El modelo básico de valores extremos se centra en el análisis del comportamiento estadístico siguiente:

32

Vol. 2, núm. 2

Sin embargo, esto no es útil en la práctica de inmediato debido a que la distribución F es desconocida. Una posibilidad es utilizar técnicas estadísticas estándar para estimar F de los datos observados y, entonces, sustituir esta estimación en la expresión anterior. Desafortunadamente, pequeñas variaciones en la estimación de F pueden generar grandes discrepancias en F n. Un enfoque alternativo es aceptar que F es desconocido y buscar familias aproximadas para F n, las cuales pueden ser estimadas sólo sobre las bases de los datos extremos. Esto es similar a la práctica usual de aproximar la distribución muestral de medias a través de una distribución normal, justificándolo mediante el teorema del límite central. Los argumentos que serán presentados a continuación son en esencia los análogos en valores extremos a la teoría del límite central. , Así, se busca estudiar el comportamiento de F n cuando pero esto, por sí solo, no es suficiente: para cualquier z< z +, donde z + es el punto frontera superior de F (esto es, z + es el menor valor de z tal que F(z)=1), F n(z) 0 cuando , por lo que la distribución de Mn degenera en una masa puntual sobre z +. Esta dificultad se evita mediante una re-normalización lineal de la variable Mn :

33

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

donde es una sucesión de variables aleatorias independientes que tienen una función de distribución común F. En teoría, la distribución de Mn puede ser derivada de manera exacta para todos los valores de n.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

para sucesiones de constantes y Las selecciones apropiadas de las y estabilizan la localización y la escala de a medida que n se incrementa, evitando las dificultades que surgen con la variable M n.

Teorema de tipos extremos

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

El rango completo de distribuciones límite posibles para el teorema 1, conocido como de tipos extremos. Teorema 1 Si existen sucesiones de constantes a medida que

y

está dado por

tales que: ,

donde G es una función de distribución no degenerada, entonces G pertenece a una de las siguientes familias:

I:



II:

III:

para parámetros

y, en el caso de las familias II y III, α > 0.

De manera colectiva, las tres clases se llaman distribuciones de valores extremos, con los tipos I, II y III conocidos como las familias Gumbel, Fréchet y Weibull, en ese orden. Cada una tiene un parámetro de localización y 34

escala, b y a, de manera respectiva; de forma adicional, las familias Fréchet y Weibull tienen un parámetro de forma α.

Los tres tipos de límites que resultan del teorema 1 tienen formas distintas de comportamiento correspondientes a las formas diferentes de las colas de la distribución F de la variable . Esto puede hacerse preciso mediante la consideración del comportamiento de la distribución límite G en z + , su punto frontera superior. Para la distribución Weibull, . Sin embargo, la densidad de G decae de manera exponencial para la distribución Gumbel y polinomial en la distribución de Fréchet, correspondientes a tasas hasta cierto punto diferentes de decaimiento en la cola de F. Se ha visto que en las aplicaciones, las tres familias proporcionan representaciones muy diferentes en cuanto al comportamiento de valores extremos. En las primeras aplicaciones de la teoría de valores extremos era usual adoptar una de las tres familias y, entonces, estimar los parámetros relevantes de esta distribución. Pero existen dos debilidades: primero, se requiere una técnica para seleccionar cuál de las tres familias es la más apropiada para los datos; segundo, una vez que la decisión se ha tomado, las inferencias subsecuentes asumen que esta selección es correcta y no se clarifica el nivel de incertidumbre asociado con ella aun cuando la duda pudiera ser grande. Un mejor análisis es realizar una reformulación del modelo en el teorema 1. Es directo constatar que las familias Gumbel, Fréchet y Weibull pueden ser combinadas en una sola que tenga funciones de distribución de la siguiente forma:

definida sobre el conjunto satisfacen

y

, donde los parámetros . Ésta es la llamada familia 35

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

2.2. Distribución generalizada de valores extremos

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

generalizada de distribuciones de valores extremos (GEV, por sus siglas en inglés). El modelo tiene tres parámetros: uno de localización, , otro de escala, , y el último de forma, . Las clases de tipo II y III de valores extremos corresponden, respectivamente, a los casos y en esta parametrización. El subconjunto de la familia GEV con =0 se interpreta como el límite de la expresión anterior cuando , que deriva en la familia Gumbel con función de distribución dada por:

La unificación de las tres familias originales de distribuciones de valores extremos en una familia simple conlleva una simplificación importante en cuanto a su implementación estadística. A través de la inferencia sobre los datos por sí mismos determinan el tipo más apropiado del comportamiento de la cola y no existe necesidad de realizar juicios subjetivos a priori acerca de cuál familia de valores extremos particular hay que adoptar. Más aún, la incertidumbre en el valor inferido de mide la duda acerca de cuál de los tres tipos originales es el más apropiado para un conjunto de datos particular. Por conveniencia, se modifica el teorema 1 en la forma siguiente: Teorema 2 Si existe una sucesión de constantes a medida que

y

tales que: ,

para una función de distribución no degenerada G, entonces G es miembro de la familia GEV:

definida sobre 36

, donde

,

y



para n suficientemente grande. De forma equivalente:

donde G * es otro miembro de la familia GEV. En otras palabras, si el teorepor un miembro de ma 2 permite la aproximación de la distribución de la familia GEV para n grande, la distribución de Mn puede en sí misma ser aproximada por un miembro diferente de la misma familia. Debido a que los parámetros de la distribución tienen que ser estimados de cualquier forma, es irrelevante en la práctica el que los parámetros de la distribución G sean diferentes de los de G*. Este argumento conduce al siguiente enfoque para la modelación de una serie de observaciones extremas e independientes X1, X2 , ... . Los datos son agrupados en una sucesión de observaciones de longitud n generando una serie de bloques de máximos, Mn,1,... Mn,m, por ejemplo, sobre los cuales se puede ajustar la función de distribución GEV. Con frecuencia, los bloques se seleccionan para que correspondan a un periodo anual, en cuyo caso n es el número de observaciones en un año y el máximo del bloque es el máximo anual. Las estimaciones de los cuantiles extremos de la distribución anual máxima son obtenidas entonces mediante el despeje de zp :

37

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Interpretando el límite en el teorema 2 como una aproximación para valores grandes de n, se sugiere de inmediato el uso de la familia GEV para la modelación de la distribución de máximos para grandes sucesiones de valores. La dificultad aparente de que las constantes de normalización sean desconocidas, se resuelve rápido en la práctica. Suponiendo la validez de , se tiene que:

Boletín del Sistema Nacional de Información Estadística y Geográfica

donde G(zp)=1-p. En terminología común, zp es el nivel de retorno asociado con el periodo de retorno 1/p, debido a que con un grado razonable de precisión se espera que el nivel zp sea excedido, en promedio, cada 1/p años. De manera más precisa, zp es excedido por el máximo anual en cualquier año en particular con una probabilidad p.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Debido a que los cuantiles permiten que los modelos de probabilidad sean expresados en la escala de los datos, la relación entre el modelo GEV y sus parámetros es más fácil de interpretar en términos de las expresiones de cuantiles. En particular, definiendo se tiene que:

de lo cual se sigue que si zp se grafica contra yp en escala logarítmica (o, de manera equivalente, si zp se grafica en contra de log yp ), la figura resultante . Si , la gráfica es convexa con límies una recta en el caso de que te asintótico cuando ; si , la gráfica es cóncava y no tiene cota finita. Esta figura es la gráfica de nivel de retorno. Debido a la simplicidad de interpretación, y puesto que la selección de la escala comprime la cola de la distribución a medida que el efecto de extrapolación se intensifica, las gráficas de nivel de retorno son, en particular, convenientes tanto para la presentación del modelo como para su validación.

2.3. Formulación del modelo del mayor estadístico de orden r Una dificultad implícita en cualquier análisis de valores extremos es la cantidad limitada de datos para la estimación del modelo. Los extremos son escasos, por definición, por lo que los estimadores del modelo, en especial los niveles de retorno extremos, tienen una gran varianza. Este hecho ha motivado la investigación del comportamiento de los valores extremos que permitan la modelación de otros datos además de éstos. 38

Vol. 2, núm. 2

Como en las secciones previas, supóngase que X1, X2 ,... es una sucesión de variables aleatorias independientes y distribuidas de forma idéntica; se busca caracterizar el comportamiento extremo de las Xi . Con anterioridad, se obtuvo que la distribución límite de Mn cuando , convenientemente re-escalado, es GEV. Primero se extiende este resultado a otros estadísticos de orden extremos, mediante la consideración de la siguiente notación: Mn(k) = mayor k-ésimo de {X1,... Xn}, e identificando el comportamiento límite de esta variable, para un k fijo, cuando . El siguiente es un resultado que generaliza el teorema 1. Teorema 3 Si existe una sucesión de constantes



y

tales que:

cuando

para una función de distribución no-degenerada G, por lo que G es la función de distribución GEV. Entonces, para un k fijo,

definida sobre

, donde

39

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Existen dos caracterizaciones generales bien conocidas: una se basa en el nivel de excedencia de un umbral grande y el otro, en el comportamiento del mayor estadístico de orden r dentro de un bloque, para valores pequeños de r . En esta sección se analiza el segundo enfoque.

Boletín del Sistema Nacional de Información Estadística y Geográfica

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

con

El teorema 3 implica que si el k-ésimo mayor estadístico de orden en un bloque es normalizado en exactamente la misma forma como el de los máximos, entonces la distribución límite es de la forma y los parámetros corresponden a los de la distribución límite GEV de los máximos por bloques. De nuevo, absorbiendo las constantes de escala desconocidas en los parámetros de localización y escala del modelo, se sigue que, para una n grande, la distribución aproximada de Mn (k) se encuentra dentro de la familia , sin embargo, existe una dificultad al utilizar ésta como modelo. La situación radica en el hecho de que, con frecuencia, se tiene cada uno de los mayores estadísticos de orden r dentro de cada uno de los diversos bloques, para algún valor de r ; esto es, usualmente se tiene un vector completo

para cada uno de los diversos bloques. Ahora bien, el teorema siguiente proporciona la función de densidad conjunta de la distribución límite. Teorema 4 Si existe una sucesión de constantes

y

tal que:

cuando para alguna función de distribución no degenerada G entonces, para un r fijo, la distribución límite cuando de

40

Vol. 2, núm. 2

se encuentra dentro de la familia de probabilidad conjunta siguiente:

donde: ;

;

;

En el caso en que r=1 la expresión de f(z(1),...,z(r)) se reduce a la familia GEV de funciones de densidad. El caso en f(z(1),...,z(r)) se interpreta como la forma límite cuando que lleva a considerar la siguiente familia de funciones de densidad:

en la cual, en el caso en que r=1, se reduce a la familia Gumbel.

3.

Presentación de las bases de datos de trabajo

Como ya se mencionó, la información analizada fue tomada de la base de datos de la ENIGH 2004, con poco más de 25 mil registros que se tuvieron como muestra en dicho año. A su vez, contiene 114 variables que corresponden a los diversos conceptos captados por la Encuesta. De éstas, para los fines que tiene el presente trabajo, se analizó sólo el ingreso corriente ya que es la variable que se utiliza con más frecuencia para diversos estudios asociados a la distribución de los ingresos, así como en diversas exposiciones sobre pobreza y desigualdad económica.

3.1. Modelación de valores extremos Enseguida, se presentan los resultados de la aplicación del ajuste de los modelos de valores extremos al ingreso corriente comentado con anterioridad 41

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

para

; .

Boletín del Sistema Nacional de Información Estadística y Geográfica

(conviene aclarar que los datos de los ingresos se analizan de manera trimestral, por lo que se hacen dos cálculos previos: una división entre tres para mensualizarlos y otra entre mil para presentar los datos en montos de miles de pesos).

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Los distintos cálculos numéricos se llevaron a cabo en el entorno de programación R1, mediante algoritmos implementados por el autor de este trabajo (con apoyo de distintas funciones pre-programadas) y que se encuentran en las librerías evd (extreme value distributions), evir (extreme values in R) e ismev (an introduction to statistical modeling of extreme values). 3.1.1. Análisis de datos muestrales En este caso, la base de datos para las estimaciones se formó con los 32 ingresos máximos (uno por cada entidad federativa en México). Los estimadores de máxima verosimilitud son:

=96.7472019,

=45.9867624, =0.7335034.

La log-verosimilitud maximizada es igual a 186.2534. La matriz aproximada de varianza-covarianza de los estimadores de los parámetros es:

V=

89.5089566 80.9045078 -0.4852417

80.9045078 -0.48524169 110.9888776 0.37863181 0.3786318 0.04618974

La diagonal de esta matriz corresponde a las varianzas de los parámetros individuales ( , , ). Tomando las raíces cuadradas, los errores estándar son:

http://www.r-project.org/

1

42

Vol. 2, núm. 2

Ahora, para obtener un intervalo de confianza más fino, se puede utilizar la verosimilitud perfil. La figura 1 muestra la forma de la verosimilitud perfil para , de la cual se obtiene que un intervalo de confianza de 95% es [0.3750751,1.2328328], el cual no difiere demasiado del intervalo encontrado con anterioridad, aunque vale la pena apreciar que se encuentra más separado del origen.

Figura 1

-189

-187

del ingreso corriente muestral

-191

Profile Log-likelihood

Verosimilitud perfil para

0.2

0.4

0.6

0.8

1.0

1.2

Shape Parameter

43

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Combinando los valores de los estimadores con estos errores se tienen intervalos de confianza aproximados de 95 por ciento. Para : [78.2038,115.2906]; para : [25.33792,66.63561]; para : [0.3122642,1.154743]. Es de notarse que el estimador para el parámetro de forma, , adquiere un valor positivo, y el intervalo de confianza no toma como valor al cero, con lo cual se concluye, hasta este momento, que los estimadores de máxima verosimilitud son regulares, entendiendo con ello que guardan las propiedades asintóticas usuales y, a su vez, se tiene una fuerte evidencia de que la distribución de los ingresos corrientes es acotada. A su vez, se observa que este modelo corresponde al caso Fréchet.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Ahora, los estimadores e intervalos de confianza de los niveles de retorno se obtienen mediante la sustitución de ( , , ) en sus expresiones adecuadas. Para consultar los resultados ver la tabla 1, que muestra una lista de valores seleccionados de p iguales a 1/10, 1/20, 1/50, 1/1000, para un nivel de confianza de 95%, donde SD es la desviación estándar, LI y LS significan límite inferior y superior, respectivamente, de los intervalos de confianza.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Tabla 1

p

Valores de retornos y sus intervalos de confianza para diferentes valores de p zp

var( zp )

SD( zp )

LI

1/10

360.7154

1/20

587.9198

1/50

1 131.083

1/100

1 864.841

2 008 736

1/1000

9 978.522

154 919 736

LS

12 445.84

111.5609

142.0600

579.3708

65 373.51

255.6824

86.79137

1 089.048

486 551.6

697.5325

-236.0559

2 498.221

1 417.299

-913.0137

4 642.695

12 446.68

-14 416.51

34 373.56

Se observa que el intervalo de confianza para el nivel de retorno que se asocia a p= 1/50 es negativo, lo cual no tiene sentido. De hecho, haciendo un recorrido, valor por valor, se puede observar que el nivel de retorno más grande (en el cual todavía es positivo) corresponde a p= 1/29 con un valor para el límite inferior de 4.659732, pues cuando p= 1/30, el valor asociado es igual a -5.539881. Se puede obtener un mejor nivel de precisión haciendo uso de la verosimilitud perfil. Para el caso en que p= 1/10, en la figura 2 se muestra la verosimilitud perfil asociada para el nivel de retorno; en este caso, el intervalo de confianza asociado es [225.7576,854.5455]. La figura 3 presenta diversos gráficos diagnósticos para dilucidar sobre el nivel de precisión del modelo GEV. El papel de probabilidad resulta muy razonable (a). A su vez, la curva del periodo de retorno proporciona una representación bastante satisfactoria a los estimadores empíricos (b). Por último, la densidad estimada correspondiente parece ser consistente con el histograma de los datos (c). Así, estas gráficas indican coherencia en el sentido de que se tiene un modelo GEV genuino. 44

Figura 2

200

400

600

800

Return Level

Figura 3

Diagnóstico del GEV para los ingresos corrientes muestrales

Return Level 0.008

f(Z)

6000

Return Level

0

0.000

2000

0.004

1.0 0.8 0.6

Model

0.4 0.2 0.0

0.0

Density Plot

10000

Probality Plot

0.2

0.4

0.6

Empirical (a)

0.8

1.0

1e-01

1e+00

1e+01

1e+02 1e+03

Return Period (b)

0

200 400

600 800 1000

Z (c)

45

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

-192 -196 -200

Profile Log-likelihood

-188

Verosimilitud perfil para un nivel de retorno de 10 años en el ingreso corriente muestral

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

3.1.2. Modelación del mayor estadístico de orden r

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

La información para el análisis de valores extremos lo constituye ahora una base de datos de 11 columnas y 32 filas, de las cuales la primera es categórica e indica la entidad federativa. La primera de las 10 restantes indica el monto máximo del ingreso corriente (cada fila asociada a la entidad federativa correspondiente). La segunda se asocia con los segundos mayores ingresos en cada entidad y así sucesivamente. Los estimadores de máxima verosimilitud y los errores estándar se encuentran en la tabla 2.

Tabla 2

Valores de máxima verosimilitud, valores de los estimadores y desviaciones estándar (en paréntesis) del mayor estadístico de orden r para los ingresos corrientes con diferentes valores de r

r

l

1

112.5706

9.6726536 (0.9454867)

4.5955733 (1.0522120)

0.7333521 (0.2147981)

2

180.8059

9.8346805 (0.8520110)

5.3217175 (0.9769762)

0.6006352 (0.1281792)

3

220.2122

10.1782587 (0.8849974)

5.7471100 (1.0801218)

0.6559741 (0.1260355)

4

238.8337

10.5173094 (0.9199496)

6.0890276 (1.1875823)

0.7031854 (0.1225096)

5

251.6549

11.1019218 (0.91613978)

6.1324087 (1.07616196)

0.6060055 (0.09438516)

6

257.2880

11.4379924 (0.93522316)

6.3102925 (1.07958444)

0.5935319 (0.08619768)

7

257.6421

11.7631766 (0.93931364)

6.3856233 (1.04568401)

0.5636176 (0.07782278)

8

248.6247

11.1781777 (0.76163516)

5.7097576 (0.79823035)

0.5251102 (0.06555131)

9

228.9636

11.9789095 (0.93732075)

6.4392685 (1.02443504)

0.5601436 (0.06927137)

10

210.0924

12.1211447 (0.93654245)

6.4686667 (1.00810101)

0.5509865 (0.06593525)

Se observa que en el caso de y a medida que se incrementa el valor de r, en general crece también el valor del estimador, salvo cuando r=8, situación que es hasta cierto punto inversa en el caso de . Sin embargo, si la aproximación asintótica es válida para una selección particular de r, entonces los estimadores de los parámetros deberían ser estables cuando el modelo se ajusta con un número menor de estadísticos de orden. De la tabla 2 se obtiene que hay poca evidencia de estabilidad sobre el parámetro de forma, sobre todo cuando r ≥ 8. 46

3.2. Medidas de bondad de ajuste de diversos modelos En esta sección se realizarán diversos ajustes a formas distribucionales que han sido muy utilizadas en la modelación de los ingresos en diversos contextos.

Es utilizado para la modelación de los ingresos debido a que incluye una gran cantidad de distribuciones que, a su vez, también se utilizan mucho para estos y otros fines. La forma distribucional ajustada es:

Aquí B es la función beta y b es un parámetro de escala, mientras que los otros son de forma. En este caso, el ajuste asociado proporciona los siguientes estimadores:

a= 1.248196 x 1012, b= 2.909646 x 101, p= 5.031926 x 10-12, q= 7.173998 x 10-13.

El histograma de los datos sobre la curva ajustada se muestra en la figura 4(a), donde se observa que el ajuste es relativamente razonable; sin embargo, como se ve en (b), la gráfica qq es muy irregular, por lo cual no resulta adecuado este modelo.2

Conviene señalar que se acostumbra en la práctica estadística tomar como indicador de ajuste las gráficas qq más que estadísticos de bondad de ajuste, pues tienen problemas en determinarse de manera precisa sobre todo en las colas de la distribución, que es justo lo que intenta estudiarse.

2

47

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

3.2.1. Modelo beta generalizado II

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Llevando a cabo la prueba de Kolmogorov-Smirnov, se tienen los siguientes hallazgos: el estadístico de Kolmogorov-Smirnov tiene un valor de 0.75, p-value = 0.002342.

Figura 4

Histograma de observaciones extremas y su ajuste al modelo beta generalizado II qq-plot de datos

0.3

0.008

0.0

0.000

0.002

0.1

0.004

Var. 2 0.2

0.006

Frecuencias relativas

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Histograma de los datos: ajuste BGII

0

200

400

600

800

1000

Ingresos corrientes 2004 (a)

1200

0.0

0.2

0.4

0.6

0.8

Var. 1 (b)

3.2.2. Modelo log-normal Una distribución que ha sido importante en el estudio de ajustes a datos de los ingresos es la log-normal. Una variable aleatoria es log-normal si su logaritmo natural es una variable normal. De manera más específica, puede mostrarse que la función de densidad de una variable log-normal con parámetros y adquiere la siguiente forma:

48

En la figura 5 se muestran algunas formas gráficas que adquiere la distribución log-normal, cuando . Se puede apreciar que la distribución es muy dinámica y con el cambio de los valores de sus parámetros se tienen formas parecidas a las distribuciones de los ingresos. Más aún, el modelo log-normal también es de colas pesadas.

Figura 5

2.0

=10 =3/2 =1 =1/2 =1/4 =1/8

1.5

1.0

0.5

0.0

0.5

1.0

1.5 x

2.0

2.5

3.0

Los parámetros ajustados resultan ser:

En la figura 6(a) se muestra el histograma de los datos junto con el ajuste a la distribución log-normal. Se observa un fuerte parecido con respecto a la gráfica correpondiente al modelo beta generalizado II. A pesar de que, efectivamente, el modelo log-normal es un caso particular del primero, al no considerar parámetros que no aportan una descripción significativa a los 49

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Formas de la densidad de una variable log-normal cuando

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

datos pueden obtenerse mejores valores en cuanto a los ajustes. De hecho, así ocurre pues el estadístico de Kolmogorov-Smirnov es 0.3333 y el p-valor asociado tiene un valor de 0.5176. Se ve, sin embargo, que el gráfico qq es muy deficiente (b), donde se nota que existe una observación muy extrema.

Ajuste de los datos a una distribución log-normal y qq-plot de datos a la distribución log-normal qq-plot de datos

0.000

0.0

0.002

0.1

0.004

0.2

Var. 2

0.006

0.3

0.008

Histograma de los datos: ajuste log-normal

Frecuencias relativas

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Figura 6

0

200

400

600

800

1000

1200

Ingresos corrientes 2004 (a)

0.0

0.2

0.4

0.6

0.8

Var. 1 (b)

Conclusiones y recomendaciones •

50

La modelación de valores extremos comparada con la beta generalizada II y la log-normal parece ser superior en cuanto al ajuste. Sin embargo, debido a la gran dificultad que tienen éste y virtualmente todos los estadísticos de bondad de ajuste en cuanto a su precisión en las colas de las distribuciones, los investigadores han optado por utilizar herramientas gráficas de diagnóstico para el análisis, siendo las más utilizadas los





51

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009



gráficos qq. En todos los casos, estas gráficas señalaron que los modelos beta generalizado II y log-normal no son superiores (e, incluso, es probable que sean inferiores) al modelo de Fréchet proveniente de la teoría de valores extremos. Asociado con el punto anterior, cabe destacar que debido a que el parámetro resultó positivo en todos los casos analizados y su intervalo de confianza asociado (95%) no contenía valores negativos ni al cero, el modelo que mejor ajusta a los datos extremos del ingreso corriente es el Fréchet, desde la óptica de la modelación de valores extremos, del estadístico de mayor orden r y de la modelación de umbral (esta última no presentada en este artículo). La modelación podría darse de manera multivariada, en el sentido de que no se analice de forma aislada sólo una de las variables sino con las que pudieran ser auxiliares a ella. Esto es, si por ejemplo el ingreso corriente es la fundamental en el análisis, podría utilizarse la información de otras auxiliares de manera conjunta multivariada, o bien, podría darse el caso de tratar de encontrar la distribución conjunta de las variables de ingreso y gasto simultáneamente. De nuevo, por la gran cantidad de combinaciones que pueden darse de subconjuntos de variables, se abren amplias avenidas de investigación. En la práctica existe un fuerte problema referente a la poca disponibilidad que tienen algunos de los informantes a proporcionar datos acerca de su ingreso, esto es cierto en especial en los informantes de los estratos superiores del ingreso (que puede darse por razones de seguridad o por suspicacias de filtrado no deseado de información). Esto lleva a plantear la necesidad de realizar un ajuste en la distribución del ingreso tomando en cuenta, por ejemplo, la información que proporciona la oficina de cuentas nacionales en México. Este mecanismo, a pesar de que ha sido explorado por algunos investigadores (sobre todo de manera cualitativa) todavía no está muy desarrollado tanto en sus cuestiones teóricas como en las operativas. Así, a pesar de que no es un problema que

Boletín del Sistema Nacional de Información Estadística y Geográfica

se derive de manera directa del estudiado en este trabajo, parece conveniente hacer explícita esta necesidad con el objetivo de que análisis como el que se presentó en este trabajo se vean beneficiados al contar con información más fidedigna.

Fuentes Angle, J. The Salamander: A Model of the Right Tail of the Wage Distribution Truncated by INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Top coding. The Pareto, Zipf and other power laws, en: http://www.fcsm.gov/03papers/ Angle_Final.pdf, 2002. Bartels, C.P. y Van Metelen. “Alternative Probability Density Function of Income”, en: Vrije University Amsterdam. Research memorandum 29. 1975, 30 pp. Boccanfuso, D. et al. “Poverty, Income Distribution and CGE Modeling: Does the Functional Form of Distribution Matter?”, en: Centre Interuniversitaire sur le risqué, les politiques économiques et l’emploi. Working Paper 03-32, http://ideas.repec.org/p/lvl/lacicr/0332.html, 2003. Champernowne, D. G. “A model for income distribution”, en: The Economic Journal. Vol. 63, núm. 250, 1953. Chávez-Demoulin, V. y A. Roehrl. Extreme Value Theory can save your neck, en: http:// www.approximity.com/papers/evt_wp.pdf, 2004. Coles, S. An Introduction to Statistical Modeling of Extreme Values. Londres, Springer, 2004. Dagum, C. “A new model for personal income distribution: specification and estimation”, en: Economie Applique’e. Núm. 30, 1977. Dowd, K. The Extreme Value Approach to VaR-An Introduction, en: http://www.fenews. com/fen11/extreme.html, 2006. ------“Extreme Value Theory”, en: Engineering Statistics Handbook, http://www.itl.nist. gov/div898/handbook/apr/section1/apr163.htm Gumbel, E.J. “Les valeurs extrêmes des distributions statistiques”, en: Annales de l’IHP. Tomo 5, núm. 2, 1935. Majumbder, A. y S. R. Chakravarty. “Distribution of Personal Income: Development of a new Model and its Applications to U.S. Income Data”, en: Journal of Applied Econometrics. Vol. 5, núm. 2, 1990. Nirei, M. y W. Souma. Two factor model of income distribution dynamics, en: http://www. comdig.org/index.php?id_issue=2004.48, 2004. 52

Vol. 2, núm. 2

Parker, S.C. “The generalized beta as a model for the distribution of earnings”, en: Economics Letters. Núm. 62. 1999. Salem, A.B.Z. y T. D. Mount. “A Convenient Descriptive Model of Income Distribution: The Gamma Density”, en: Econométrica. Vol. 42, núm. 6, 1974. Singh, S.K. y G. S. Maddala. “A function for Size distribution of Incomes”, en: Econométrica. Vol. 44, núm. 5, 1976. Stone, R. et al. “The Precision of National Income Estimates”, en: The Review of Economic Studies. Vol. 9, núm. 2, 1942. Wu, X. y J. M. Perloff. China’s Income Distribution over Time: Reasons for Rising Inequality, 2004. ------- China’s Income Distribution, 1985-2001, en: http://are.berkeley.edu/~perloff/PDF/ china.pdf, 2005. Yeh, H.C. et al. “Pareto Process”, en: Journal of Applied Probability. Vol. 25, núm. 2, 1988. Zenga, M. y A. Zini. A modification of the right tail for heavy-tailed income distributions, en: http://econpapers.repec.org/article/mtnancoec/2001_3A3_3A02.htm, 2000.

53

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

en: http://siteresources.worldbank.org/INTDECABC2006/Resources/Pradeep.PDF,

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

El valor del alquiler de la vivienda en México

Jael Pérez Sánchez*

Debido a la importancia que tiene el valor del alquiler de la vivienda en México, tanto para el Sistema de Cuentas Nacionales como para los estudios del bienestar y pobreza, se propone un modelo para hacer la estimación de este indicador de aquellas viviendas habitadas por sus dueños. El modelo se construye a partir de las viviendas efectivamente rentadas, asumiendo que éste es un mercado competitivo. La selección de variables para la construcción del modelo se hace según la ubicación y características de las viviendas rentadas para, después, con los parámetros del modelo, estimar el valor del alquiler de las viviendas habitadas por sus propietarios. Palabras clave: alquiler de la vivienda, estimación, mercado competitivo, hogares, créditos hipotecarios.

* Jefe del Departamento de Estadística Derivada en la Dirección Regional Centro Norte del Instituto Nacional de Estadística y Geografía (INEGI). Teléfono: (444) 834 18 36; correo electrónico: [email protected]

54

Por lo general, se considera a la vivienda como uno de los principales activos que tienen los hogares1; también, es muy aceptado que tiene una relación directa con el bienestar; si expresamos éste en términos de la dotación de ingreso que tienen los hogares en un determinado momento del tiempo, la vivienda se convierte en un diferencial importante, pues es fácil observar que en aquellos hogares con igualdad de condiciones demográficas y dotación de ingreso, pero donde uno de ellos cuente con la hipoteca pagada, éste podrá destinar la cantidad que pagaría por la amortización del crédito de su vivienda a diferentes formas de consumo, lo cual se traduce en un mayor nivel de bienestar en comparación con el que tenga que pagar una hipoteca o alquiler de su vivienda.2 Sin embargo, la vivienda juega diferentes roles a lo largo del ciclo de vida de los hogares y no sólo como un medio de satisfacción del uso habitacional pues, por ejemplo, puede servir como un depósito en garantía para acceder a otro tipo de créditos del hogar o incluso de terceros; también, se puede adaptar parte de la vivienda para realizar actividades productivas no desligadas del presupuesto familiar3; otro uso que se le da con mayor frecuencia es como generador de ingresos por medio del arriendo. Una diferencia importante entre ser propietario o no radica en las potencialidades de este uso múltiple. Las personas a lo largo de su vida toman diferentes decisiones de consumo y ahorro; la hipótesis del ciclo vital de vida plantea que los individuos hacen planes para un largo periodo con el fin de distribuir el primero de la mejor manera posible a lo largo de su vida.4 Por lo tanto, la decisión de adquirir una vivienda es una de las más importantes que tienen que tomar los individuos, pues en el caso de los créditos hipotecarios plantea la necesidad de destinar una parte importante de sus rentas al pago de la hipoteca por un largo periodo que puede ir, en el caso de México, desde los cinco hasta los 30 años.5 Canberra Group. The final report and recomendations. Otawa, Canberra Group, 2001. Ídem. 3 Fuentes, Álvaro. La vivienda como un activo de los hogares. Chile, CEPAL, 1999. 4 Romer, David. Macroeconomía avanzada. España, McGraw-Hill Companies, 2002. 5 Para conocer más sobre créditos hipotecarios en México, visitar http://www.shf.gob.mx/clientes/2_2_informacion_acreditados.html 1 2

55

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

La vivienda como un activo de los hogares

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Otra forma potencial de consumo se trata de aquellos casos donde los flujos de ingreso han disminuido (como ejemplo se puede citar a las personas jubiladas) donde es posible recurrir a la venta de la vivienda para acceder al mismo nivel de bienestar que en periodos pasados, pues ésta constituye un medio de riqueza.6 Sin embargo, el adquirir una vivienda plantea un reto adicional ya que su valor total, en la mayoría de las ocasiones, rebasa el presupuesto familiar (de los hogares) para muchos periodos pues, como se mencionó con anterioridad, el adquirirla plantea un compromiso de largo plazo y exige, en la mayoría de los casos, un pago proporcional para acceder a un crédito hipotecario; por lo tanto, significa un sacrificio de consumo presente en los hogares por mucho tiempo para ahorrar la parte proporcional del crédito; después de conseguirlo, significa sacrificar parte del consumo del hogar por muchos periodos más. La complejidad de adquirir una vivienda no termina ahí, pues se ha supuesto sólo la parte de sacrificar el consumo presente por varios periodos para acceder al crédito, pero no se ha tenido en cuenta que mientras los miembros del hogar hacen ese ahorro, tienen que vivir en algún lugar. Muchas veces, el apoyo de otros hogares se convierte en algo importante para lograr esta hazaña, por ejemplo, se pueden citar los casos donde los padres resguardan en su vivienda a los hijos que han formado un nuevo hogar como una medida de apoyo mientras los flujos de ingreso y de ahorro son lo suficientemente grandes para acceder a una vivienda propia. En cuanto a los hogares que no tengan este apoyo u otro similar, tendrán que alquilar una vivienda, lo cual plantea un doble esfuerzo que merma la capacidad de consumo del hogar, pues en el caso de querer adquirir una casa propia, significaría ahorrar la parte proporcional de la hipoteca y el pago del alquiler de la vivienda que habitan. Existen otras modalidades para poder ser propietario de una vivienda sin que implique un desembolso inicial del hogar: créditos de INFONAVIT, Canberra Group. Op. cit.

6

56

Por otro lado, si se consideran los resultados dados a conocer por el Consejo Nacional de Evaluación de la Política de Desarrollo Social7 respecto a las cifras de pobreza para el 2006, cerca de 14.4 millones de mexicanos se encuentran en pobreza alimentaria, lo cual implica de manera directa que este grupo social no estaría en posibilidad de pagar la hipoteca de una vivienda. El mercado de alquileres se hace posible debido, sobre todo, a que muchos hogares no tienen las condiciones para acceder a una hipoteca o, en algunos casos, son hogares de reciente creación que aún no reúnen los requisitos para obtenerla. En México, según los datos de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2006, aproximadamente 43% de las viviendas que se habitan son rentadas o prestadas, ya sea por el centro de trabajo o un familiar.

Mercado de alquileres Las estimaciones del valor neto imputado del alquiler a nivel macro constituyen un insumo fundamental para los sistemas de cuentas nacionales de los países.8 Canberra Group da la siguiente definición: “En teoría, la renta imputada es la diferencia entre el costo del alquiler de una vivienda (en un mercado competitivo) menos los costos realmente incurridos por ser propietario de la misma (o alquilarla por debajo de un precio de mercado). Así, necesitamos estimar el valor bruto de la renta, menos los gastos por ser propietario, Consejo Nacional de Evaluación de la Política de Desarrollo Social. Comunicado de prensa 002/2007. México, CONEVAL, 2007. 8 Canberra Group. Op. cit. // Grupo Intersecretarial sobre Cuentas Nacionales. Sistema de Cuentas Nacionales 1993. Washington, DC, Grupo Intersecretarial sobre Cuentas Nacionales, 1993. 7

57

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

FOVISSSTE, etc.; sin embargo, también son mecanismos excluyentes pues para calificar para alguno de estos créditos se tiene que cotizar por cierto tiempo como empleado y, según datos de la Encuesta Nacional de Ocupación y Empleo (ENOE) del segundo semestre del 2008, alrededor de 38% de los subordinados y remunerados no tienen prestaciones laborales por su trabajo.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

tales como impuestos, depreciación, reparación y mantenimiento, los intereses impuestos a la propiedad, vivienda y otros gastos”.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Por su parte, en el Sistema de Cuentas Nacionales de 1993 se considera a los hogares que habitan su propia vivienda como empresas no constituidas en sociedad que autoconsumen el servicio de alojamiento de su propia vivienda; se recomienda que dicha valoración se haga a los precios de mercado tomando en cuenta su “…ubicación, amenidades y servicios de la zona, etc., así como las dimensiones y calidad de la vivienda”.9 En ambas definiciones se pone de manifiesto que el alquiler imputado es igual al costo de la renta de una vivienda en un mercado competitivo (Canberra Group extiende un poco más la definición sobre los gastos realmente incurridos del hogar por habitarla); es aquí donde radica el principal problema con la estimación del alquiler de los hogares que habitan su propia vivienda debido a que muchas personas pueden sobrevalorar o subvalorar el costo del alquiler de la misma. La vivienda pudo ser dejada como herencia a los hogares y, por lo tanto, el costo que estarían dispuestos a pagar por su alquiler sería alto en relación con el costo en un mercado competitivo; también, pueden existir casos donde suceda que las personas no estén informadas sobre el costo de los alquileres en el mercado y por eso sobrevaloren o subvaloren su vivienda. Bajo el principio de optimización de la economía, los individuos tratan de elegir las mejores pautas de consumo que estén a su alcance; por lo tanto, un hogar que esté dispuesto a arrendar su vivienda tratará de hacerlo al mejor precio posible; sin embargo, el mercado le hará ver su realidad. Como se mencionó, el precio del alquiler de una vivienda, sin duda, tiene que ver con su ubicación; así, dos casas de igual dimensión en terreno y construcción e igualdad en su estado de conservación se diferenciarán en su precio si están en diferente lugar. Por ejemplo, entre la vivienda A que se Ídem.

9

58

El diferencial entre los precios dependerá del valor de la tierra; así, por ejemplo, dos viviendas de iguales características físicas pero una ubicada en una zona regular en la ciudad de México y otra con buena ubicación en la ciudad de Aguascalientes, seguramente el alquiler de la primera será más caro que el de la segunda, pese a que las condiciones de los servicios que rodean a ésta sean mejores. Existen ciudades donde el valor de uso del suelo es muy caro, por lo tanto, el habitar una vivienda en ellas tendrá un precio muy elevado.10 Por otro lado, se puede analizar el caso de dos viviendas (A* y B*), las cuales están localizadas en la misma colonia o fraccionamiento (en las orillas de la ciudad), cuentan con iguales características de espacio de terreno y de construcción, pero se diferencian en su interior. La A* tiene clósets de buena madera y bien conservados, además de una cocineta en buen estado y, de manera adicional, tina de baño; la B* no cuenta con estas características. El precio de alquiler (p´*) de la vivienda A* será, necesariamente, mayor que el de la B*, sin embargo, al comparar el precio p´* de la vivienda A* contra el de la A del ejemplo anterior (de similares características a B*, pero de mejor ubicación), el precio p* será estrictamente mayor al precio p´*. Así, viviendas 10

Canberra Group. Op. cit.

59

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

encuentra ubicada en el primer cuadro de la ciudad (donde existen todos los servicios públicos, como: recolección de basura, alumbrado, buen estado de calles y banquetas; transporte urbano y supermercados a sólo unas pocas cuadras) y la vivienda B (de similares características físicas) que está localizada a las orillas de la ciudad donde los servicios públicos (alumbrado, calles…) no son tan eficientes, la preferencia de alquiler sería sobre la primera aun cuando los precios del mercado sean iguales para ambas, es decir, todos los hogares querrán arrendar una vivienda del tipo A y muy pocos, del B; sin embargo, el principio de equilibrio del mercado hará caer en su realidad tanto a los oferentes como a los demandantes, de tal manera que los precios del alquiler de las viviendas tipo A y B se irán ajustando hasta lograr el equilibrio, de tal forma que las viviendas alquiladas de tipo A se asignarán a los hogares que estén dispuestos a pagar el precio p*, que necesariamente deberá ser mayor al precio p** de las viviendas tipo B.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

que tengan igual ubicación y se diferencien en algunas condiciones al interior de éstas tendrán un diferencial en el precio, el cual no será mayor al diferencial en precio del alquiler que tengan las viviendas de similares características pero con diferente ubicación.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Algunos aspectos importantes a destacar en el mercado de alquileres es que es bastante estable, es decir, no cambia de forma abrupta de un mes a otro, pues la cantidad de hogares que adquieren una vivienda propia no cambia de manera sustancial en este periodo, ni tampoco lo hace la oferta (no se pueden construir muchas viviendas en tan poco tiempo). Por los motivos expuestos en los párrafos precedentes, se tiene la hipótesis de que el mercado de las viviendas efectivamente alquiladas en México es competitivo y que los precios imputados por los hogares que habitan su vivienda se encuentran contaminados por la percepción de quien declara el valor del alquiler. Por lo tanto, en el siguiente apartado se construye un modelo con los datos de las viviendas rentadas que ayuda a imputar el valor del alquiler de las viviendas no rentadas con el fin de comparar la diferencia entre el alquiler imputado por el declarante y el del valor estimado por el modelo.

Construcción del modelo Con la base de datos de la ENIGH 2006 se hizo una selección de variables para construir un modelo para aquellas viviendas que se encuentran alquiladas; después, una vez construido, se hizo la estimación del valor del alquiler para las viviendas que se encuentran habitadas por sus dueños. Las variables seleccionadas para la construcción del modelo son: 1. Estratificación que se hace para las áreas de marginación del Consejo Nacional de Población (CONAPO). 2. Estratificación que hace el INEGI para el diseño de la muestra. 3. Materiales con los cuales están construidos los muros de la vivienda. 60

Fue necesario realizar una recodificación de aquellas variables categóricas o cualitativas, donde se le dio un valor de 1 para los casos en los que el resultado de la pregunta fuera positivo, por ejemplo, en cuanto a los materiales con los cuales fueron construidos los muros se calificó con 1 cuando la respuesta fue concreto, tabique, block, piedra, concreto y adobe; en el resto de los casos se puso 0 (cartón, material de desechos, carrizo, bambú, etcétera). Al sacar las correlaciones entre las variables, aquéllas más correlacionadas con el alquiler de las viviendas fueron el número de focos (.62), de baños (.58) y de cuartos (.49), y si cuenta con gas estacionario (.42) y teléfono (.35). Después de explorar varios modelos, el de mejor ajuste fue el siguiente:

donde y es el alquiler que declararon pagar las personas que habitan una vivienda rentada; x1, número de cuartos; x2 , número de baños; x3, número de focos; x4 si la vivienda cuenta con cisterna (variable indicadora, 1 para sí cuenta y 0 no cuenta); x5 si cuenta con gas estacionario (variable indicadora); 61

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

4. Materiales con los cuales están construidos los techos de la vivienda. 5. Materiales con los cuales están construidos los pisos de la vivienda. 6. Años de antigüedad de la vivienda. 7. Si cuenta con cuarto de cocina. 8. Número de cuartos. 9. Disponibilidad de agua dentro de la vivienda. 10. Las preguntas relacionadas con el baño de la vivienda (cuenta con baño, disponibilidad de agua, baño exclusivo y número). 11. Cuenta con drenaje. 12. Cuenta con energía eléctrica. 13. Cuenta con cisterna. 14. Cuenta con gas estacionario. 15. Cuenta con aire acondicionado. 16. Cuenta con teléfono.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

x6 si tiene teléfono (variable indicadora); x7 variable de zonas de marginación de CONAPO.

Una vez estimado el modelo para las viviendas alquiladas, con los coeficientes del modelo se hizo la estimación del alquiler para las habitadas por sus dueños.11 En la gráfica 1 se muestra el diagrama de caja (boxplot) de los datos declarados por las personas encuestadas referente a la pregunta: ¿cuánto cobraría usted si estuviera rentando su vivienda?12 (primer boxplot) y los modelos construidos para la estimación del alquiler (el modelo 4 fue el seleccionado). Al hacer la estimación del alquiler, 42 registros dieron como resultado un valor negativo; a ellos se les imputó un valor de 0, ya que no se puede alquilar una vivienda por debajo de 0 pesos. 12 Ver la pregunta 2 del apartado 2.5 del cuestionario de la ENIGH 2006. 11

Gráfica 1

2e+04

4e+04

6e+04

8e+04

1e+05

Boxplot de estimaciones vs. real

0e+00

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Todos los coeficientes de este modelo fueron significativos con una r-cuadrada de .508.

original

62

modelo 1

modelo 2

modelo 3

modelo 4

En la gráfica 2 se muestra la estimación del alquiler de las viviendas propias de los cuatro modelos construidos, sin embargo, se optó por el modelo 4 debido a que estima de mejor manera el valor de aquellas viviendas con mejor ubicación y mejores características.

Boxplot de estimaciones

modelo 1

modelo 2

modelo 3

modelo 4

La gráfica 3 muestra la comparación entre la densidad13 del valor declarado por las personas en la ENIGH14 y la densidad del alquiler estimado por el modelo construido. La gráfica 4 presenta la densidad del alquiler de las viviendas rentadas declarada en la Encuesta y la densidad del alquiler estimado por el modelo.

Sólo están graficados los valores por debajo de 30 mil pesos debido a que existen seis valores mayores a esta cantidad que distorsionan la perspectiva de la gráfica. 14 Ver nota al pie núm. 12. 13

63

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

0

5 000

10 000

15 000

Gráfica 2

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Es fácil observar que la forma de las dos densidades es muy similar (de hecho la media y la moda son muy cercanas), sin embargo, la caída de la curva de los datos estimados es más suave que la de los datos declarados por los habitantes de sus propias viviendas. Gráfica 3

8e-04 0e+00

2e-04

4e-04

Densidad

6e-04

8e-04

Densidad de datos estimados, m4

6e-04 4e-04 0e+00

2e-04

Densidad

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Densidad de datos originales

Gráfica 4

0

5 000

10 000

15 000

cobraria[which(cobraria < 30 000)] viviendas propias

0

5 000

10 000

15 000

pred_propias4 viviendas propias

Nota: m4 se refiere al modelo 4.

En la comparación de las densidades que se hizo para el caso del alquiler que pagan las personas que rentan una casa y la del alquiler derivado del modelo construido, se puede observar que ambas son muy similares (ver gráficas 5 y 6). La diferencia que existe es que la caída de la curva de densidad de las viviendas rentadas es un poco irregular comparada con la estimación que se hace por medio del modelo construido. 64

Gráfica 5

6e-04

0

5 000

10 000

renta viviendas rentadas

15 000

0

5 000

10 000

15 000

pred_propias4 viviendas propias

Una diferencia adicional es que la curva de las viviendas alquiladas tiene mucho más peso para valores alrededor de 1 700 pesos que la curva dibujada por el modelo construido.

Conclusiones Se reconoce que la vivienda es uno de los principales activos con los que cuentan los hogares, la cual se puede destinar para actividades productivas por miembros del hogar y como depósito en garantía para préstamos personales del hogar, entre otros usos. El mercado de alquileres en México tiene una importancia alta, pues alrededor de 42% de los hogares no es dueño de la vivienda que habita; por tanto, la calidad de la imputación del alquiler de la vivienda de aquellas que son habitadas por sus dueños es fundamental para el sistema de contabilidad nacional y estudios que tengan relación con el bienestar y la pobreza. 65

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

0e+00

2e-04

4e-04

Densidad

4e-04 0e+00

2e-04

Densidad

6e-04

8e-04

Densidad de datos estimados, m4

8e-04

Densidad de viviendas rentadas

Gráfica 6

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Se considera que el mercado de alquileres en México (de las viviendas efectivamente alquiladas) es un mercado competitivo y, por otro lado, la estimación del alquiler de las viviendas que son habitadas por sus dueños puede estar contaminada, derivado del desconocimiento de los precios del mercado de alquileres por parte de quien declara dicho valor en la ENIGH.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

El modelo construido estima de buena forma el valor del alquiler de las viviendas habitadas por sus dueños, por lo tanto, se considera una opción viable explorar con más detalle esta clase de modelos para hacer la imputación del alquiler de las viviendas habitadas por sus dueños.

Otras fuentes Boiles, Guillermo. “El Banco Mundial y la política de vivienda en México”, en: Revista Mexicana de Sociología. México, Instituto de Investigaciones Sociales, 2004. INEGI. Encuesta Nacional de Ingresos y Gastos de los Hogares 2006. México, INEGI, 2007. ----- Encuesta Nacional de Ocupación y Empleo. México, INEGI, 2008. González Arrieta, Gonzalo. “Acceso a la vivienda y subsidios habitacionales directos, experiencias latinoamericanas”, en: Revista de la CEPAL. Chile, CEPAL, 1999. ----- “El crédito hipotecario y el acceso a la vivienda para los hogares de menores ingresos en Latinoamérica”, en: Revista de la CEPAL. Chile, CEPAL, 2005. Presidencia de la República. Plan Nacional de Desarrollo 2007-2012. México, Secretaría de Hacienda y Crédito Público, 2007. R. Pindyck y D. Rubinfeld. Econometric models and econometric forecasts. México, McGrawHill Companies, 1998.

66

Resultados de la Encuesta Origen-Destino de la ZMVM 2007 bajo un enfoque exploratorio de datos Ricardo Rodarte García*

Trasladarse en cualquier medio de transporte, sea público o privado, en la ciudad de México se ha convertido en una de las problemáticas más severas que enfrentan los residentes de la Zona Metropolitana del Valle de México (ZMVM). El tiempo promedio de un viaje en transporte público es de casi una hora en el Distrito Federal y en el estado de México apenas disminuye en 4 minutos; en el privado es de 38 minutos y de 32, en ese mismo orden. De los casi 22 millones de viajes que se realizan en un día hábil en la ZMVM, 12.8 millones se producen en el Distrito Federal y 9 millones, en el estado de México. Éstos son algunos de los resultados obtenidos de la última encuesta, realizada en la metrópoli más grande del país, durante cinco semanas (entre mayo y junio del 2007), para contar con los elementos que permitan a las autoridades locales y metropolitanas elaborar medidas que redunden en un eficiente sistema de movilidad de la ZMVM. Palabras clave: transporte, movilidad urbana, viajes y modelos lineales.

* Maestro en Sociología del Trabajo. Coordinador estatal en la Dirección Regional Centro. Teléfono: (55) 52 78 10 00, ext. 7444; correo electrónico: [email protected]

67

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Los viajes en la Zona Metropolitana del Valle de México.

Boletín del Sistema Nacional de Información Estadística y Geográfica

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Introducción El presente estudio hace, en primera instancia, un análisis exploratorio de los viajes que realizan los residentes de dicho entorno geográfico en los diversos medios de transporte. En la segunda sección se propone un modelo de regresión lineal multivariado que muestra las variables que explican la cantidad de viajes que se realizan en algún tipo de transporte para los 156 distritos en que se dividió la región de estudio captada por la encuesta: 84 del Distrito Federal y 72 del estado de México. Las estadísticas mostradas al interior del documento se derivan, exclusivamente, de la Encuesta Origen-Destino de los Residentes de la ZMVM (EOD), 2007.

Objetivos Identificar y modelar la relación de los viajes realizados por los residentes de la ZMVM en algún tipo de transporte (público, privado, mixto y otro) a partir del análisis del número de viajes realizados en las delegaciones y municipios, así como del tipo de transporte más utilizado.

Metodología Se lleva a cabo un análisis exploratorio de datos con la intención de identificar las relaciones entre variables dentro del mismo conjunto de información. Este método permite organizar los datos, detectar errores en el diseño, tratamiento de datos faltantes o de atípicos, y la comprobación de supuestos que atañen al conjunto de datos por medio de técnicas multivariadas, como: normalidad, linealidad y homocedasticidad. Para ello se elaboran gráficas de una variable (univariadas) con el fin de analizar su comportamiento y gráficas combinadas de variables (bivariadas) para identificar si existe alguna relación entre ellas, o bien, cuáles son las que más se relacionan; ambos tipos de gráficas se acompañan de un análisis numérico para conocer aspectos de dicha información. 68

Vol. 2, núm. 2

En el cuadro estadístico 1 (tabla de frecuencias) se presentan las variables que interactúan con el total de los viajes realizados por los residentes de la ZMVM obtenidos a través de la EOD 2007; el estudio se centra en los viajes realizados en transporte público (VTPub) en su conjunto: sistema colectivo metro, tren ligero, metrobús, trolebús, autobús de pasajeros de la Red de Transportes de Pasajeros (RTP), autobús de pasajeros suburbano, colectivo y taxi. Transporte privado (VTPriv): automóvil, motocicleta y bicicleta. Transporte mixto (VTMx), la combinación de transporte público y privado y otro tipo (VTO), incluye transportes foráneo, escolar y de personal, entre otros, el cual es desagregado por delegación del Distrito Federal y municipio del estado de México como destino del viaje, esto dado que el interés radica en conocer la atracción de viajes por cada espacio geográfico. Conviene señalar que al cuadro 1 se le hizo un ajuste en la presentación de los datos con la intención de mostrar dentro del mismo dos tipos de desagregaciones: la primera acumulable a nivel del ámbito metropolitano conformado por las dos entidades de estudio y fuera de ellas; y el segundo, a nivel delegacional o municipal según el caso. En el cuadro 1 podemos observar, de acuerdo con la frecuencia de viajes por tipo de transporte, que por cada 100 viajes que se efectúan en la Zona Metropolitana, 58 son internos o atraídos por el Distrito Federal, otros 41 tienen como destino final alguno de los 40 municipios considerados del estado de México, ya sea que se generen al interior de ellos o que provengan de otro espacio geográfico, y una mínima proporción se cuantifican en otro lugar fuera del ámbito de análisis. Por otra parte, el uso de transporte público representa poco más de dos veces a los desplazamientos en algún medio privado. De igual manera, se aprecia que la cantidad de viajes del estado de México con destino a alguna delegación del Distrito Federal es mayor que en sentido inverso. Por delegación y municipio sobresalen en el total de viajes Iztapalapa, Cuauhtémoc y Gustavo A. Madero, para el caso del Distrito Federal, y Ecatepec de Morelos, por el estado de México, con porcentajes por arriba de 6% en cada ámbito político-administrativo. El uso de transporte público en tales 69

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Análisis exploratorio de los viajes

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Cuadro 1 Tabla de frecuencias





Continúa

Viajes de los residentes de la ZMVM por la delegación o municipio según tipo de transporte, 2007.

Frecuencias relativas Tipo de transporte Total Pú- PriMixde bli- vaOtros to viajes co do

Ámbito geográfico

Total de viajes

09 Distrito Federal

12 833 615

8 689 511

3 948 912

43 133

152 059

58.5

58.7

58

69.6

55.6

649 253

457 327

185 616

2 002

4 308

3

3.1

2.7

3.2

1.6

1 103 951

660 596

410 814

3 775

28 766

5

4.5

6

6.1

10.5

248 984

153 956

86 512

861

7 655

1.1

1

1.3

1.4

2.8

1 453 531

1 035 564

391 936

4 164

21 867

6.6

7

5.8

6.7

8

002 Azcapotzalco

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Frecuencias absolutas Tipo de transporte PúPriMixblivato co do

003 Coyoacán 004 Cuajimalpa de Morelos 005 Gustavo A. Madero 006 Iztacalco 007 Iztapalapa 008 La Magdalena Contreras 009 Milpa Alta

Otros

491 666

362 307

124 574

1 428

3 357

2.2

2.4

1.8

2.3

1.2

1 812 574

1 305 278

482 062

4 744

20 490

8.3

8.8

7.1

7.7

7.5

234 041

152 198

78 217

581

3 045

1.1

1

1.1

0.9

1.1

79 677

61 016

17 539

76

1 046

0.4

0.4

0.3

0.1

0.4

010 Álvaro Obregón

954 641

608 876

329 987

2 713

13 065

4.3

4.1

4.8

4.4

4.8

011 Tláhuac

277 306

208 327

64 895

398

3 686

1.3

1.4

1

0.6

1.3

012 Tlalpan

853 662

514 697

327 582

3 158

8 225

3.9

3.5

4.8

5.1

3

013 Xochimilco

394 941

289 306

100 320

713

4 602

1.8

2

1.5

1.2

1.7

014 Benito Juárez

986 277

561 530

413 303

3 335

8 109

4.5

3.8

6.1

5.4

3

015 Cuauhtémoc

1 695 206

1 260 590

417 109

9 478

8 029

7.7

8.5

6.1

15.3

2.9

016 Miguel Hidalgo

941 402

567 394

358 104

3 558

12 346

4.3

3.8

5.3

5.7

4.5

017 Venustiano Carranza

656 503

490 549

160 342

2 149

3 463

3

3.3

2.4

3.5

1.3

9 028 821

6 087 006

2 814 700

17 889

226

41.1

41.1

41.4

28.9

39.9

002 Acolman

75 861

46 011

29 235

615

0.3

0.3

0.4

0

0.2

009 Amecameca

27 543

20 624

6 331

588

0.1

0.1

0.1

0

0.2

011 Atenco

38 681

16 988

21 141

72

480

0.2

0.1

0.3

0.1

0.2

013 Atizapán de Zaragoza

474 526

273 573

188 341

1 079

11 533

2.2

1.8

2.8

1.7

4.2

020 Coacalco de Berriozábal

338 947

228 672

107 373

636

2 266

1.5

1.5

1.6

1

0.8

0.1

0.1

0

0

0

128

1 912

0.6

0.6

0.6

0.2

0.7

015 Estado de México

109

023 Coyotepec

14 344

13 318

1 026

024 Cuautitlán

123 204

81 953

39 211

025 Chalco 028 Chiautla 029 Chicoloapan de Juárez

70

202 770

151 683

49 137

161

17 729

7 677

9 979

73

152 661

111 297

39 860

512

1 789

992

0.9

1

0.7

0.3

0.7

0.1

0.1

0.1

0.1

0

0.7

0.8

0.6

0.8

0.4

Cuadro 1 Tabla de frecuencias





Concluye

Viajes de los residentes de la ZMVM por la delegación o municipio según tipo de transporte, 2007.

030 Chiconcuac de Juárez 031 Chimalhuacán 033 Ecatepec de Morelos

Total de viajes

17 877

8 488

Otros

9 389

Frecuencias relativas Tipo de transporte Total Pú- PriMixde bli- vaOtros to viajes co do 0.1

0.1

0.1

0

0

298 287

243 735

50 805

622

3 125

1.4

1.6

0.7

1

1.1

1 439 748

1 059 387

363 206

2 220

14 935

6.6

7.2

5.3

3.6

5.5

035 Huehuetoca

48 161

37 570

9 080

202

1 309

0.2

0.3

0.1

0.3

0.5

037 Huixquilucan

204 118

117 028

83 363

232

3 495

0.9

0.8

1.2

0.4

1.3

039 Ixtapaluca

315 747

232 672

79 074

450

3 551

1.4

1.6

1.2

0.7

1.3

044 Jaltenco

19 224

14 737

3 533

474

480

0.1

0.1

0.1

0.8

0.2

053 Melchor Ocampo

31 405

14 226

14 414

220

2 545

0.1

0.1

0.2

0.4

0.9

057 Naucalpan de Juárez

937 117

547 980

374 629

2 306

12 202

4.3

3.7

5.5

3.7

4.5

058 Nezahualcóyotl

897 062

654 645

235 857

1 680

4 880

4.1

4.4

3.5

2.7

1.8

638

0.1

0.1

0.2

0

0.2

184

3 032

0.9

1.1

0.6

0.3

1.1

059 Nextlalpan

26 221

12 267

13 316

060 Nicolás Romero

201 364

158 757

39 391

069 Papalotla

4 693

2 599

2 017

77

0

0

0

0

0

070 La Paz

184 602

149 372

34 445

172

613

0.8

1

0.5

0.3

0.2

075 San Martín de las Pirámides

26 505

12 535

13 644

37

289

0.1

0.1

0.2

0.1

0.1

081 Tecámac

283 872

176 161

103 306

899

3 506

1.3

1.2

1.5

1.5

1.3

091 Teoloyucan

50 097

35 462

13 363

1 272

0.2

0.2

0.2

0

0.5

092 Teotihuacan

53 994

32 348

21 201

299

0.2

0.2

0.3

0.2

0.1

146

093 Tepetlaoxtoc

16 192

9 649

6 486

57

0.1

0.1

0.1

0.1

0

095 Tepotzotlán

53 703

36 502

14 814

404

1 983

0.2

0.2

0.2

0.7

0.7

099 Texcoco

266 150

156 476

107 689

429

1 556

1.2

1.1

1.6

0.7

0.6

100 Tezoyuca

20 250

13 231

6 550

215

254

0.1

0.1

0.1

0.3

0.1

103 Tlalmanalco

24 273

19 534

4 210

62

467

0.1

0.1

0.1

0.1

0.2

104 Tlalnepantla de Baz

842 457

555 691

274 070

1 901

10 795

3.8

3.8

4

3.1

3.9

108 Tultepec

84 563

55 851

26 021

212

2 479

0.4

0.4

0.4

0.3

0.9

109 Tultitlán

344 700

243 840

94 196

187

6 477

1.6

1.6

1.4

0.3

2.4

120 Zumpango

155 569

68 536

83 930

727

2 376

0.7

0.5

1.2

1.2

0.9

121 Cuautitlán Izcalli

557 062

340 426

209 995

1 078

5 563

2.5

2.3

3.1

1.7

2

122 Valle de Chalco Solidaridad

149 909

119 146

29 798

112

853

0.7

0.8

0.4

0.2

0.3

125 Santa María Tonanitla

7 633

6 359

1 274

0

0

0

0

0

Fuera de la ZMVM

91 721

35 453

43 123

0.4

0.2

0.6

1.6

4.5

966

12 179

Nota: la suma de los porcentajes puede ser distinta de 100 debido al redondeo. Fuente: INEGI. Encuesta Origen-Destino de los Residentes de la ZMVM, 2007. Base de datos.

71

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Ámbito geográfico

Frecuencias absolutas Tipo de transporte PúPriMixblivato co do

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

delegaciones y municipios muestra comportamientos semejantes, en tanto que en el privado, además de estos lugares predominantes, se incluyen Coyoacán y Naucalpan de Juárez con porcentajes arriba de 5%, en transporte mixto destaca Cuauhtémoc que presenta poco más de 15% de los viajes.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

En virtud del interés que se tiene por analizar la información de los viajes dentro del entorno metropolitano, es conveniente precisar que la revisión se restringirá a la información exclusiva del Distrito Federal y de los municipios en muestra del estado de México, excluyendo el resto de los viajes que se realizan fuera de éstos. En el cuadro 2 se presentan los principales estadísticos para cada uno de los componentes de estudio: total de viajes, viajes en transporte público, viajes en transporte privado, viajes en transporte mixto y viajes en otro tipo, realizados en los 56 municipios y 16 delegaciones de estudio. A partir de los resultados obtenidos, se puede señalar que en el entorno de esta metrópoli de estudio, Iztapalapa es la delegación con la mayor cantidad de viajes (ver cuadro 1, tabla de frecuencias) y el municipio de Papalotla, en el estado de México, tiene el menor número. Cuadro 2

Estadístico Viajes

Estadísticos de los viajes según tipo de transporte Viajes por tipo de transporte

Total

Público

21 862 436

14 776 517

Privado

6 763 612

Mínimo

4 693

2 599

1 026

Máximo

1 812 574

1 305 278

482 062

Mixto

Otro tipo

61 022

261 285

9 478

28 766

1er. quantil

45 791

29 417

14 222

103

615

3er. quantil

580 110

386 062

186 297

1 491

5 792

Mediana

203 444

151 941

57 850

417

2 512

Media

390 401

263 866

120 779

1 090

4 666

2.14E+11

1.04E+11

1.99E+10

2 792 107

36 205 127

462 265

321 944

140 909

1 671

6 017

Varianza Desviación estándar Intervalo de confianza para la media 95% L. superior

269 328

179 546

83 873

652

3 090

L. inferior

511 473

348 187

157 684

1 527

6 242

Nota: cálculos obtenidos con el sistema R versión 2.5.0. Fuente: INEGI. Encuesta Origen-Destino de los Residentes de la ZMVM, 2007.

72

En las delegaciones o municipios se obtuvo un promedio de viajes por día hábil (lunes a viernes) de 390 401 (media) y en la mitad de los municipios y/o delegaciones se registraron, al menos, 203 444 (mediana).

Para este análisis, se considera conveniente transformar los datos originales a partir del uso de logaritmos base 10 como un caso especial de la técnica más general de transformación de variables para distinguir relaciones directas; si la relación logarítmica no es lineal, es posible transformar una variable en otra función, como: la exponencial, funciones raíz, el recíproco o combinaciones de esas funciones; la decisión de cuál transformación utilizar se toma bajo el criterio de mantener una adecuada interpretación de los datos en virtud de que: uno, las unidades de medida se alteran y dos, de la experiencia. En este caso particular, la función logaritmo en base 10 produce un ajuste lineal satisfactorio, es decir, permite que exista una dispersión uniforme de puntos alrededor de la línea de regresión y conserva una adecuada interpretación de los datos. El cuadro 3 muestra el resultado de este procedimiento. Cuadro 3

Continúa

Datos transformados de los viajes a base logarítmica

Entidad

Delegación y municipio

Viajes por tipo de transporte Total

Público

Privado

Mixto

Otros

09

002

Azcapotzalco

5.8

5.7

5.3

3.3

3.6

09

003

Coyoacán

6.0

5.8

5.6

3.6

4.5

09

004

Cuajimalpa de Morelos

5.4

5.2

4.9

2.9

3.9

09

005

Gustavo A. Madero

6.2

6.0

5.6

3.6

4.3

09

006

Iztacalco

5.7

5.6

5.1

3.2

3.5

09

007

Iztapalapa

6.3

6.1

5.7

3.7

4.3

09

008

La Magdalena Contreras

5.4

5.2

4.9

2.8

3.5

73

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

De acuerdo con el tipo de transporte utilizado, se tiene que los viajes en transporte público presentan las cifras más significativas, con 263 866 en promedio, poco más de dos veces con respecto a lo registrado en transporte privado; la mitad de los registros resaltan con poco más de 151 941 viajes en transporte público, en tanto que en el privado, en la mitad de dichos municipios y/o delegaciones, se efectúan menos de 57 850 viajes.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Cuadro 3

Continúa

Datos transformados de los viajes a base logarítmica

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Entidad

Delegación y municipio

Viajes por tipo de transporte Total

Público

Privado

Mixto

Otros

Álvaro Obregón

6.0

5.8

5.5

3.4

4.1

011

Tláhuac

5.4

5.3

4.8

2.6

3.6

09

012

Tlalpan

5.9

5.7

5.5

3.5

3.9

09

013

Xochimilco

5.6

5.5

5.0

2.9

3.7

09

014

Benito Juárez

6.0

5.7

5.6

3.5

3.9

09

015

Cuauhtémoc

6.2

6.1

5.6

4.0

3.9

09

016

Miguel Hidalgo

6.0

5.8

5.6

3.6

4.1

09

017

Venustiano Carranza

5.8

5.7

5.2

3.3

3.5

15

002

Acolman

4.9

4.7

4.5

0.0

2.8

15

009

Amecameca

4.4

4.3

3.8

0.0

2.8

15

011

Atenco

4.6

4.2

4.3

1.9

2.7

15

013

Atizapán de Zaragoza

5.7

5.4

5.3

3.0

4.1

15

020

Coacalco de Berriozábal

5.5

5.4

5.0

2.8

3.4

15

023

Coyotepec

4.2

4.1

3.0

0.0

0.0

15

024

Cuautitlán

5.1

4.9

4.6

2.1

3.3

15

025

Chalco

5.3

5.2

4.7

2.2

3.3

15

028

Chiautla

4.2

3.9

4.0

1.9

0.0

15

029

Chicoloapan de Juárez

5.2

5.0

4.6

2.7

3.0

15

030

Chiconcuac de Juárez

4.3

3.9

4.0

0.0

0.0

15

031

Chimalhuacán

5.5

5.4

4.7

2.8

3.5

15

033

Ecatepec de Morelos

6.2

6.0

5.6

3.3

4.2

15

035

Huehuetoca

4.7

4.6

4.0

2.3

3.1

15

037

Huixquilucan

5.3

5.1

4.9

2.4

3.5

15

039

Ixtapaluca

5.5

5.4

4.9

2.7

3.6

15

044

Jaltenco

4.3

4.2

3.5

2.7

2.7

15

053

Melchor Ocampo

4.5

4.2

4.2

2.3

3.4

15

057

Naucalpan de Juárez

6.0

5.7

5.6

3.4

4.1

15

058

Nezahualcóyotl

6.0

5.8

5.4

3.2

3.7

15

059

Nextlalpan

4.4

4.1

4.1

0.0

2.8

15

060

Nicolás Romero

5.3

5.2

4.6

2.3

3.5

15

069

Papalotla

3.7

3.4

3.3

0.0

1.9

15

070

La Paz

5.3

5.2

4.5

2.2

2.8

09

009

Milpa Alta

09

010

09

74

4.9

4.8

4.2

1.9

3.0

Cuadro 3

Concluye

Datos transformados de los viajes a base logarítmica Delegación y municipio

Viajes por tipo de transporte Total

Público

Privado

Mixto

Otros

15

075

San Martín de las Pirámides

4.4

4.1

4.1

1.6

2.5

15

081

Tecámac

5.5

5.2

5.0

3.0

3.5

15

091

Teoloyucan

4.7

4.6

4.1

0.0

3.1

15

092

Teotihuacan

4.7

4.5

4.3

2.2

2.5

15

093

Tepetlaoxtoc

4.2

4.0

3.8

1.8

0.0

15

095

Tepotzotlán

4.7

4.6

4.2

2.6

3.3

15

099

Texcoco

5.4

5.2

5.0

2.6

3.2

15

100

Tezoyuca

4.3

4.1

3.8

2.3

2.4

15

103

Tlalmanalco

4.4

4.3

3.6

1.8

2.7

15

104

Tlalnepantla de Baz

5.9

5.7

5.4

3.3

4.0

15

108

Tultepec

4.9

4.7

4.4

2.3

3.4

15

109

Tultitlán

5.5

5.4

5.0

2.3

3.8

15

120

Zumpango

5.2

4.8

4.9

2.9

3.4

15

121

Cuautitlán Izcalli

5.7

5.5

5.3

3.0

3.7

15

122

Valle de Chalco Solidaridad

5.2

5.1

4.5

2.0

2.9

15

125

Santa María Tonanitla

3.9

3.8

3.1

0.0

0.0

Fuente: INEGI. Encuesta Origen-Destino de los Residentes de la ZMVM, 2007. Base de datos.

Análisis gráfico Para tal efecto, se realizó un conjunto de gráficas de las cinco componentes de análisis (ver gráfica 1); en la diagonal se presentan los histogramas de cada una de ellas (dado que éstas son de tipo discreto y que son distintas en su mayoría, se agrupan las frecuencias con la intención de encontrar la forma de su distribución y, en su caso, la existencia de diversas modas que pongan en evidencia la presencia de grupos homogéneos dentro del universo de análisis); fuera de la diagonal se muestran gráficas de puntos, las cuales reflejan las relaciones entre combinaciones de variables, por ejemplo, total de viajes vs. viajes en transporte público, total de viajes vs. viajes en transporte privado. A través de dichos gráficos se aprecia el comportamiento en su forma natural y la información de los viajes en sus diferentes tipos de transporte. 75

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Entidad

Boletín del Sistema Nacional de Información Estadística y Geográfica Gráfica 1

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Distribución de los viajes por combinaciones de componentes

En los histogramas se agrupa a los elementos (delegaciones y/o municipios) conforme al rango de concentración, tal es el caso total de viajes (T_VIAJES); en la parte izquierda muestra un grupo de delegaciones y/o municipios con la mínima participación, posteriormente varía su comportamiento y alcanza un máximo en alrededor de 5 por ciento. Al considerar el supuesto de normalidad, en apariencia, hay un comportamiento bimodal como resultado del efecto de dos distribuciones con distinta media, esto es, que posiblemente haya dos factores importantes (viajes en transporte público y en transporte privado) que influyen en la determinación de los viajes, por lo que sus observaciones asociadas presentan volúmenes importantes y distintos por cada municipio o delegación. Cabe señalar que la distribución registra una media de 390 401 y una mediana de 203 444 viajes, lo cual explica el hecho de que la gráfica muestre una cola ligeramente más larga del lado izquierdo en comparación con la del lado derecho, esto es, más de 50% de las delegaciones y/o municipios presentan cifras inferiores al valor de la mediana, otro 17% (10 delegaciones y municipios) oscilan entre la mediana y la media y 33% de las observaciones se ubican por arriba de la media. 76

Vol. 2, núm. 2

En el caso de las variables VTMx y VTO (ver gráfica 3), se pueden distinguir dos conjuntos de datos separados, esto es, que existe una amplia diferencia entre los valores menos representativos con el grueso de los datos. Si se observan los datos de los estadísticos mediana y media, se aprecia que el valor de la mediana es de poco menos de la mitad de la media. Para VTO, el comportamiento es similar, donde se puede observar que algunos municipios del estado de México no registran viajes en ambos tipos de transporte, tal es el caso de Coyotepec, Chiconcuac de Juárez y Santa María Tonanitla. Gráfica 2

Total de viajes y viajes en transporte público Viajes en transporte público

0.3

Frecuencias

0.0

0.1

0.2

0.3 0.2 0.1 0.0

Frecuencias

0.4

0.4

0.5

0.5

0.5

Total de viajes

3.5

4.0

4.5

5.0

Viajes

5.5

6.0

6.5

3.0

3.5

4.0

4.5

5.0

5.5

6.0

6.5

Viajes

77

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

En los histogramas correspondientes a VTPub y VTPriv (ver gráficas 2 y 3), se observan comportamientos no simétricos debido a que más de la mitad de los registros muestran cifras inferiores a la media; por señalar en transporte público, la mediana representa 151 941 y la media, 263 866 viajes, lo cual demuestra un mayor alargamiento de la cola en el lado izquierdo, dado que se identifica a 38 delegaciones y municipios con valores inferiores a la media y un menor número de dichos registros supera este valor; situación semejante se presenta en el transporte privado, como lo muestran sus estadísticos, donde 70% de las delegaciones y/o municipios registran valores inferiores al promedio de 120 779 viajes.

Boletín del Sistema Nacional de Información Estadística y Geográfica Gráfica 3

Vol. 2, núm. 2

Viajes en transporte privado, en transporte mixto y en otro tipo Viajes en transporte mixto

0.4 0.3 0.0

0.1

0.2

Frecuencias

0.2 0.1 0.0 3.0

3.5

4.0

4.5

5.0

5.5

6.0

0

1

2

Viajes

3

Viajes

0.0

0.1

0.2

0.3

0.4

0.5

Viajes en otro transporte

Frecuencias

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Frecuencias

0.3

0.4

Viajes en transporte privado

0

1

2 Viajes

78

3

4

4

Diagramas de caja (boxplot)

Así, al revisar la distribución de cada uno de los componentes de estudio, se observa que las cuatro primeras cajas tienen casi igual longitud intercuartil (ver diagrama de caja), dado que cada una contiene 28 delegaciones y/o municipios; además, es conveniente señalar que debido a la transformación de los valores reales a logaritmos, la diferencia entre el primer y tercer cuartil son semejantes; en cambio, para la correspondiente a viajes en otro tipo de transporte es más chica, lo cual equivale a tener menor variabilidad. Al cargarse las líneas a la parte superior de la caja se indica que de las 28 delegaciones y/o municipios que entraron en la caja, menos de la mitad tienen valores superiores a la mediana. Si estuvieran centradas, indicaría que la mediana es igual a la media, es decir, hay igual número de delegaciones y/o municipios en ambas partes de la caja. Por otra parte, las magnitudes de la separación de los datos (bigotes) señalan cuánto hay de diferencia entre los registros contenidos en la caja con las observaciones que están fuera de ella; entre más larga sea, habrá observaciones con valores importantes en la parte superior o parte inferior, esto se ve con las delegaciones que tienen las cifras de viajes más altas y aquellas poco representativas en cada variable, por ejemplo, Iztapalapa y Papalotla (cuadro 1, ver tabla de frecuencias). Para el caso de las medianas, se identifica que casi todas presentan líneas ligeramente cargadas a la parte superior, lo cual refleja que no son simétricas las distribuciones; y, por último, la separación de los datos para el caso de total de viajes, viajes en transporte público y viajes en transporte privado, la dispersión superior es más corta que la inferior, lo cual significa que está más distante el valor mínimo de la mayoría de los datos (ver tabla de frecuencias, 79

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Éstos juegan un papel importante porque, a primera vista, proporcionan información significativa sobre la distribución de los datos, ya que en la caja se concentra poco más de la mitad de las observaciones y al interior se distingue si existe simetría o no (depende de que tan centrada aparezca la mediana o por estar cargada hacia la parte superior o inferior). De igual manera, es posible identificar las observaciones que tienen variabilidad considerable al grado de ser consideradas como puntos atípicos.

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Diagrama de caja. Distribución de los viajes según tipo de transporte 7 6 5

Viajes

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

cuadro 1; en los tres primeros componentes se distingue con la cantidad de viajes poco significativas a Papalotla), en tanto que en viajes en transporte mixto y viajes en otro tipo, se visualizan puntos atípicos y corresponden a delegaciones o municipios que presentan cero viajes atraídos; si se consulta la tabla de frecuencias, cuadro 1, ellas serían, por señalar algunos, Chiconcuac de Juárez, Coyotepec y Santa María Tonanitla.

Q1

4

mín.

3

mediana máx.

2

Q3

1 0

Total de viajes

Público

Privado

Mixto

Otros

Tipos de transporte

Relaciones entre variables El análisis bivariado da pie a identificar las relaciones existentes entre dos variables; de hecho, forma parte del análisis multivariado en el cual se interrelacionan dos o más variables, mismas que determinarán las influencias eficientes entre el conjunto que está en estudio. 80

Para lo anterior, se describe, de manera breve, la técnica estadística de regresión lineal para mostrar una tendencia promedio de dichas relaciones: es una técnica de análisis de datos que sirve para poner en evidencia las relaciones (por ejemplo: total de viajes con viajes en transporte público y viajes en transporte público con viajes en transporte privado) que existen entre variables. En este caso, se trata de diseñar mediante este método un modelo que explique cómo una o más variables independientes determinan el comportamiento de otra dependiente. Una vez identificado este hecho, se construye un modelo que a partir del comportamiento de las variables independientes nos permita predecir el valor futuro de la característica dependiente o explicada. Este modelo de análisis de regresión persigue determinar la relación estadística que existe entre una variable dependiente ( ) y una o más variables independientes ( ). Para poder realizar esta investigación, se debe postular una relación funcional entre las variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la práctica es la relación lineal. Cuando sólo existe una variable independiente, esto se reduce a una línea recta:

81

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

Antes de plantear el modelo que servirá para pronosticar el número de viajes, se analizarán en forma bivariada las relaciones que se presentan entre los componentes en estudio con el fin de identificar la existencia de linealidad (que los viajes en cualquiera de estos cuatro tipos de transporte proporcionen suficiente información a la variable dependiente, en este caso al total de viajes), lo cual quiere decir que el número de viajes entre un municipio y otro tiene semejante proporcionalidad, pudiendo ser iguales o uno mayor a otro; por ejemplo, en Iztapalapa se realizan casi tres viajes en transporte público por uno en privado, caso contrario al municipio de Chiautla, donde se registran más viajes en transporte privado que en público, así para cada uno de los municipios.

Boletín del Sistema Nacional de Información Estadística y Geográfica

El símbolo especial representará el valor de Y calculado por la recta. El valor original de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distinción.

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

El parámetro es la ordenada al origen y el parámetro es la pendiente, la cual indica cuánto aumenta por cada aumento de una unidad en X. El problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables y X . En el análisis de regresión, estas estimaciones se obtendrán con la aplicación del método de mínimos cuadrados. Así, a partir de las cifras del cuadro 3 y de la gráfica 1 que presenta su forma distributiva se identifican las combinaciones entre los componentes: total de viajes, viajes en transporte público, viajes en transporte privado, viajes en transporte mixto y viajes en otro tipo de transporte. En cada caso particular, una de ellas será considerada como la variable dependiente o explicada ( ) y la otra como variable explicativa o independiente (X). Cada punto en la gráfica 1 muestra la pareja de datos combinados de los viajes: totales y en algún tipo de transporte público, privado, mixto u otro tipo. Asimismo, se agrega la línea de regresión con el fin de mostrar el ajuste promedio de la relación entre los componentes de estudio en dicha distribución; para ello, se utiliza el método de mínimos cuadrados para obtener los estimadores de dicha relación. Total de viajes y viajes en transporte público En esta primera representación (ver gráfica 4) se observa una tendencia positiva, esto es, que la proporción entre el total de viajes y los viajes en transporte público varía ligeramente entre delegación y/o municipio, con incrementos, también, poco variables debido a que tienen una fuerte relación entre ambas y, de acuerdo con la recta de ajuste, se puede identificar poca variabilidad ya que todos los puntos están muy cercanos a dicha trayectoria; por mencionar algunos, se tiene que de los puntos en la parte superior que corresponden a las delegaciones Iztapalapa, Cuauhtémoc y Gustavo A. Madero y del municipio de Ecatepec de Morelos, ámbitos en los que se efectúa el mayor número de viajes al registrar entre 1 millón y 1.3 millones de viajes en transporte 82

Vol. 2, núm. 2

Total de viajes y viajes en transporte privado Esta segunda regresión (ver gráfica 4) muestra también una tendencia creciente y, al igual que en la anterior, el total de viajes se incrementa en una proporción directa y cercana al incremento de los viajes en transporte privado; por ejemplo, la parte alta de la gráfica representa a cinco delegaciones (Iztapalapa, Cuauhtémoc, Benito Juárez, Coyoacán y Gustavo A. Madero) de la capital del país donde se tienen entre 390 mil y 482 mil viajes por este medio. En la primera de éstas, por cada cuatro viajes realizados uno se hace en transporte privado, lo que refleja la fuerte relación entre ambos

Gráfica 4

Comparaciones entre componentes Total de viajes vs. Viajes en transporte privado

5.5 5.0 4.0

4.5

T_Viajes

5.0 4.5 4.0

T_Viajes

5.5

6.0

6.0

Total de viajes vs. Viajes en transporte público

3.5

4.0

4.5

Público

5.0

5.5

6.0

3.0

3.5

4.0

4.5

5.0

5.5

Privado

83

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

público. Esto se confirma al analizar los principales estadísticos obtenidos por mínimos cuadrados: primero los coeficientes estimados son para el intercepto que es de 0.35 y la pendiente obtenida, de 0.97, lo que señala una fuerte influencia en el total de viajes por los viajes en transporte público, esto es, el total de viajes depende de un incremento fijo o uniforme por cada viaje realizado en transporte público. Asimismo, el error residual de 0.08 es poco significativo y el coeficiente de determinación es de 0.99, lo cual indica que los viajes en transporte público influyen fuertemente en el total de viajes.

Boletín del Sistema Nacional de Información Estadística y Geográfica

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

componentes. Sin embargo, se observa una variabilidad un poco mayor ya que las observaciones se encuentran más separadas de la línea promedio de ajuste, sobre todo en la parte inferior donde se ubican los datos más bajos, como es el caso de los municipios de Santa María Tonanitla y Papalotla (con el menor número de viajes en transporte privado). Así, de acuerdo con los estadísticos encontrados, se confirma lo siguiente: los coeficientes estimados son de 0.81 para el valor del intercepto y 0.91 de pendiente para el valor explicativo, lo que señala influencia de los viajes en transporte privado en el total de los mismos, esto es, el total de viajes depende de un incremento fijo o uniforme por cada viaje realizado en transporte privado. El error residual, es decir, la variabilidad entre el valor de las observaciones es de 0.16 y aun cuando no es relevante ya tiene más presencia. Por último, el coeficiente de determinación es de 0.94, lo cual confirma que la regresión es un buen modelo, esto es, que las cifras de los viajes totales por delegación y/o municipio tienen una influencia también fuerte por los viajes en transporte privado.

Viajes en transporte público y viajes en transporte privado Ésta es una relación entre dos componentes con formas distintas de medir los viajes. Conforme a la distribución que se aprecia en la gráfica 5, aparenta un comportamiento lineal, sin embargo, se observan ligeramente dispersos los datos con respecto a la línea promedio, lo cual indica que entre los datos de cada delegación y/o municipio con respecto al valor medio es ligeramente distante; por ejemplo, las delegaciones con mayor cantidad de viajes para esta combinación son Iztapalapa y Cuauhtémoc y en la parte inferior (menor cantidad) el municipio de Santa María Tonanitla (ver tabla de frecuencias, cuadro 1). Según los resultados de las medidas estadísticas, los coeficientes estimados son el intercepto de 0.64 y la pendiente de 0.93, lo cual señala que los viajes en transporte privado tienen influencia para los viajes en trasporte público, esto es, en el caso de Iztapalapa, por cada viaje en transporte privado, casi tres se realizan en transporte público; el error estándar es de 0.24, lo que refleja la variabilidad de los datos con respecto al promedio de ajuste y el coeficiente de determinación es de 0.88, o sea, una regresión aceptablemente ajustada. 84

Vol. 2, núm. 2

Gráfica 5

Comparaciones de viajes en transporte público y en transporte privado

5.0 3.0

3.5

4.0

4.5

5.0

5.5

Privado Privado

Resto de las relaciones Para el resto de las combinaciones de componentes (VTPub-VTMx, VTPVTO, VTPriv-VTMx, VTPriv-VOT, VTMix-VTO) se presenta el cuadro 4 con los indicadores estadísticos para determinar la linealidad de dicha combinación de componentes; en ellas se puede observar en cada combinación que la estimación de los viajes depende de una constante que traslada la recta sobre el eje vertical hacia abajo o hacia arriba, dependiendo de su signo y de la pendiente que afecta a la variable independiente. Así, como no tienen influencia considerable para el total de viajes, se omite un análisis más detallado. Cuadro 4

Indicadores estadísticos de relaciones seleccionadas

Estadístico Intercepto (y) Pendiente (x)

Públicomixto 3.83

0.51

Relaciones de viajes por tipo de transporte Público-otro PrivadoPrivadomixto otro 3.47

3.47

3.12

0.50

0.51

0.50

Mixtootro 0.13

0.70

Error estándar

0.41

0.42

0.41

0.42

0.79

Coeficiente de determinación

0.65

0.63

0.66

0.64

0.50

85

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

4.5 3.5

4.0

Público

5.5

6.0

Total en transporte público vs. Viajes en transporte privado

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

Las gráficas 6 y 7 muestran las combinaciones de viajes en transporte público o privado con mixto y otro tipo. Gráfica 6

Comparaciones de viajes en transporte público Viajes en transporte público vs. Viajes en otro transporte 6.0 3.5

3.5

4.0

4.5

Público

5.0

5.5

5.5 5.0 4.5 4.0

Público

0

1

2

3

4

0

1

Mixto

2

3

4

Otros

Gráfica 7

Continúa

Otras comparaciones de viajes por tipo de transporte

Viajes en transporte privado vs. Viajes en transporte mixto

4.5 3.0

3.0 0

86

4.0 3.5

4.0

4.5

Privado

5.0

5.0

5.5

5.5

Viajes en transporte privado vs. Viajes en otro transporte

3.5

Privado

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

6.0

Viajes en transporte público vs. Viajes en transporte mixto

1

2

Mixto

3

4

0

1

2

3

Otros

4

Gráfica 7

Concluye

Otras comparaciones de viajes por tipo de transporte

0

1

2

3

4

Otros

De lo anterior, es posible concluir que las cuatro primeras combinaciones pueden conformar el modelo general, dado que sus coeficientes de determinación son superiores a 0.68; sin embargo, las dos primeras componentes muestran con claridad que son las de mayor peso explicativo, dado que el mencionado estadístico de ajuste regresivo es superior a 0.98.

Modelo general Una vez analizadas las diferentes relaciones entre los componentes y haber obtenido la eficiencia de los modelos (regresiones con buenos ajustes), se propone el siguiente modelo general mixto que relaciona los cuatro tipos de transporte de los viajes realizados por los residentes de la Zona Metropolitana del Valle de México: La variable dependiente o explicada Y es la componente total de viajes (T_VIAJES). Considerando que las variables independientes o explicativas xi, con i=1,2,3,4, son las componentes viajes en transporte público 87

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009

2 0

1

Mixto

3

4

Viajes en transporte mixto vs. Viajes en otro transporte

Boletín del Sistema Nacional de Información Estadística y Geográfica

Vol. 2, núm. 2

(PÚBLICO) x1, viajes en transporte privado (PRIVADO) x2, Viajes en transporte mixto (MIXTO) x3 y viajes en otro tipo de transporte (OTRO) x4. De esta forma, el modelo general del tipo multivariado quedaría de la siguiente forma: Y = x1 + x2 + x3 + x4 + ε

INEGI. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica Vol. 2, Núm 2, mayo-agosto 2009



donde ε ~ N (0,1) “ ε es una variable aleatoria que se distribuye como una normal estándar”; el promedio o valor esperado de ε es cero. Al utilizar el método de mínimos cuadrados para estimar los coeficientes de determinación o influencia, de manera que se pueda realizar un pronóstico sobre el número de viajes conforme al tipo de transporte utilizado, se obtienen los resultados que se muestran en los cuadros 5 y 6. Cuadro 5

Coeficiente

Resumen de estimaciones Estimación

Error estándar

T valor

Pr(>t)

Intercepto (y)

0.371617

0.024382

15.241