La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El...

8
Capítulo 29 La regresión por mínimos cuadrados parciales: orígenes y evolución Gregoria Mateos-Aparicio Morales Universidad Complutense de Madrid Antonio Jesús Caballero Domínguez Jefe de Investigación de CFI Group de Madrid Introducción La técnica de regresión PLS o PLSR, Regresión por mínimos cuadrados parciales (Partial Least Squares Regression), se desarrolla para evitar, entre otros, el efecto de la multicolinealidad en las estimaciones de los parámetros de una regresión. El problema de la multicolinealidad, o relación de dependencia extrema entre variables explicativas en un modelo de regresión, produce situaciones de inestabilidad de los coeficientes de regresión. Los coeficientes de regresión pueden ser no significativos cuando las variables explicativas están muy correlacionadas con la variable explicada, produciendo dificultades de interpretación de la ecuación de regresión a causa de signos erráticos en los coeficientes. Este problema suele surgir cuando se usa una cantidad relativamente grande de variables explicativas, y su tratamiento más directo es reducir la dimensionalidad de dicho conjunto de variables. La pregunta que inmediatamente surge es cómo hacer dicha reducción. La respuesta suele ser buscar una serie de nuevas variables creadas como combinación lineal de las originales, de forma que se elimine el problema de la multicolinealidad. El método de Componentes Principales ha sido muy usado durante años, y hasta hace poco era el referente entre las técnicas de reducción de la dimensionalidad. Este enfoque del método de Componentes Principales aplicado a la Regresión solía denominarse Regresión por Componentes Principales o PCR (Principal Components Regression). Por su parte, el objetivo perseguido por la modelización PLS es la predicción de las variables dependientes. Este objetivo se traduce en un intento por maximizar la varianza explicada de dichas variables, por lo que PLS puede ser más adecuado para fines predictivos (Chin et al., 2003). En efecto, Wold (1979) afirma que PLS se orienta principalmente para el análisis causal predictivo en situaciones de alta complejidad pero con un conocimiento teórico poco desarrollado. También Barclay et al. (1995) concluyen que PLS se recomienda generalmente en modelos de investigación predictivos. 441

Transcript of La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El...

Page 1: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

Capítulo 29

La regresión por mínimos cuadrados parciales: orígenes y evolución

Gregoria Mateos-Aparicio Morales

Universidad Complutense de Madrid Antonio Jesús Caballero Domínguez

Jefe de Investigación de CFI Group de Madrid

Introducción

La técnica de regresión PLS o PLSR, Regresión por mínimos cuadrados parciales (Partial Least Squares Regression), se desarrolla para evitar, entre otros, el efecto de la multicolinealidad en las estimaciones de los parámetros de una regresión. El problema de la multicolinealidad, o relación de dependencia extrema entre variables explicativas en un modelo de regresión, produce situaciones de inestabilidad de los coeficientes de regresión. Los coeficientes de regresión pueden ser no significativos cuando las variables explicativas están muy correlacionadas con la variable explicada, produciendo dificultades de interpretación de la ecuación de regresión a causa de signos erráticos en los coeficientes.

Este problema suele surgir cuando se usa una cantidad relativamente grande de variables explicativas, y su tratamiento más directo es reducir la dimensionalidad de dicho conjunto de variables. La pregunta que inmediatamente surge es cómo hacer dicha reducción. La respuesta suele ser buscar una serie de nuevas variables creadas como combinación lineal de las originales, de forma que se elimine el problema de la multicolinealidad. El método de Componentes Principales ha sido muy usado durante años, y hasta hace poco era el referente entre las técnicas de reducción de la dimensionalidad. Este enfoque del método de Componentes Principales aplicado a la Regresión solía denominarse Regresión por Componentes Principales o PCR (Principal Components Regression).

Por su parte, el objetivo perseguido por la modelización PLS es la predicción de las variables dependientes. Este objetivo se traduce en un intento por maximizar la varianza explicada de dichas variables, por lo que PLS puede ser más adecuado para fines predictivos (Chin et al., 2003). En efecto, Wold (1979) afirma que PLS se orienta principalmente para el análisis causal predictivo en situaciones de alta complejidad pero con un conocimiento teórico poco desarrollado. También Barclay et al. (1995) concluyen que PLS se recomienda generalmente en modelos de investigación predictivos.

441

Page 2: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la Probabiudad y la Estadística (IV)

Las dos técnicas se comparan para la solución del problema de multicolinealidad en regresión logística funcional: uno basado en la regresión por componentes principales y otro basado en regresión PLS. PLS y PCR pretenden reducir la dimensionalidad, y, por tanto, hacer frente al problema que en muchas ocasiones presenta un conjunto de variables explicativas con un alto grado de multicolinealidad. Sin embargo, el enfoque de ambas técnicas es distinto, y por tanto, los resultados obtenidos también. Es decir, mientras que el propósito de PCR es recoger la máxima variabilidad o varianza de las variables explicativas, PLS trata de realizar lo mismo pero teniendo en cuenta además la relación entre X e Y. En otras palabras, PLS es un método más orientado a la predicción que PCR, ya que este último se centra en la reducción de la dimensionalidad de X (conjunto de variables explicativas) sin tener en cuenta la relación existente entre X e Y.

Algunos autores como Jerome Friedman o Trevor Hastie aseguran que análisis más profundos revelan que en el aspecto de recoger la máxima varianza en el problema de optimización, PLS tiende a dominar, y que, por tanto, PLS se comporta más parecido a PCR de lo que podríamos imaginar en un primer momento. Sin embargo, y a pesar de ello, en condiciones generales PLS aventaja a PCR como método predictivo de reducción de la dimensionalidad.

Orígenes y evolución de la regresión PLS

El método PLS fue desarrollado por el profesor sueco Herman Wold (mentor de Karl Joreskog, fundador del Structural Equation Modelling). En 1966 Herman Wold publicó un libro en el que presentaba formalmente el método PLS, (Wold, H., 1966), aunque entonces se denominó NIPALS (Nonlinear Iterative Partial Least Squares) (Wold, 1973), y posteriormente PLS (Wold, 1979; 1982, 1985). El diseño básico de esta técnica terminó de completarse en 1977 (Wold, 1982), y éste se ha ido ampliando en siguientes etapas (Chin, 1998b) en las que continuó aplicándose a nuevos problemas o campos.

El método PLS ha tenido una difícil evolución, ya que al principio costó mucho incluirlo en un contexto estadístico y ello ralentizó su aplicación. Herman Wold presentó por primera vez su metodología PLS aplicada a los modelos de rutas con variables latentes en 1979, aunque fue varios años más tarde, en 1982 y 1985, cuando publicó sus principales referencias de algoritmos.

Svante Wold, hijo de Herman Wold, y Harold Martens adaptaron NIPALS en 1983 para resolver el problema de la multicolinealidad en las estimaciones de los parámetros de los modelos de regresión lineal. A esta adaptación la llamaron Regresión PLS. Svante Wold, continuó la labor de su padre, aunque más centrado en el campo de la Quimiometría.

En 1990, Stone y Brooks situaron el método PLS en el campo de la "Regresión Continua", y significó el primer paso serio dado por estadísticos para situar PLS en un entorno estadístico.

El siguiente paso fue el dado por Ildiko Frank y Jerome Friedman al presentar este método como una herramienta importante en Química y Quimiometría. Fue en 1993 cuando estos dos autores lograron definitivamente situar al método PLS dentro de un contexto estadístico, más concretamente en el área del Análisis Multivariante clásico. Esta contextualización fue criticada por Svante Wold, que apoyó la publicación del trabajo de Hinkle y Rayens en el que se referían al método PLS como una técnica “composicional” de datos. Esto produjo una importante discusión en todo el mundo sobre el tipo de técnica que PLS representaba, pero esto no entorpeció su desarrollo sino que logró impulsarlo. Así, apareció una versión no lineal

442

Page 3: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la P robabilidad y la Estadística (IV)

de PLS, dando lugar a la aparición de una innumerable cantidad de algoritmos PLS aplicados a distintos problemas. En la actualidad, PLS se ha convertido en una técnica que por sí sola reúne suficiente conocimiento como para ser un campo en sí mismo, y nuevos algoritmos van apareciendo día a día, dando lugar a técnicas como la Regresión PLS Logística.

La técnica PLS además de ser una solución al problema de la multicolinealidad en un modelo de regresión, resuelve otro problema que es el que se presenta cuando el número de individuos es menor que el número de variables y cómo ello afecta a la estimación de los coeficientes de regresión. Svante Wold fue capaz de realizar mediante PLS una regresión con 10 variables y un único caso, es decir con una muestra de tamaño uno, frente a los cinco por variable que nos recomienda la estadística tradicional. Esto nos da idea de la potencialidad del método en situaciones con muestras pequeñas. PLS puede ser una poderosa herramienta de análisis por las mínimas exigencias en términos de escalas de medición, tamaño de las muestras y distribuciones residuales. PLS no precisa que los datos provengan de distribuciones normales o conocidas (Falk y Miller, 1992). La metodología PLS no impone grandes restricciones al modelo, y ello redunda en una clara simplificación de la teoría necesaria para su manejo, y del tiempo de aprendizaje. Pero hay que advertir que aunque la hipótesis de normalidad de los datos raramente se encuentra en la realidad, y a pesar de que con esta técnica se puede obviar esta restricción, los resultados y decisiones basadas en ellos quedan claramente comprometidos.

Gracias al avance informático de los últimos años, ha sido posible plantear técnicas de remuestreo o computación intensiva que nos permitan validar las estimaciones obtenidas en nuestros modelos. Tres de estas técnicas comúnmente utilizadas en modelos PLS son: la validación cruzada (o blindfolding en inglés), la de Jacknife y la de Bootstrap. El método Bootstrap fue desarrollado por Effon en 1979 y requiere de métodos de simulación para la estimación de un parámetro y de su varianza. Aunque el rendimiento del método de Bootstrap es mejor, en general, que el de Jacknife, este último es más eficiente en términos de tiempo de computación. Chin es de la opinión que en modelos PLS, las estimaciones dadas por uno o por otro deben converger.

Distintos enfoques de la Regresión PLS

Existe gran confusión en lo referente a PLS en la actualidad, tanto de autoría (en cuestiones de asignar la propuesta como mérito del padre o del hijo), como de enfoque, Regresión PLS o PLS- Path Modeling. Por ello, revisamos estos enfoques para poder entender su relación, como parte de la evolución de esta técnica.

Wold estaba en desacuerdo con la aproximación dura o hard modeling que Jôreskog propugnaba para los modelos con rutas y variables latentes. El enfoque de Jôreskog necesitaba de la imposición de fuertes hipótesis sobre la distribución de los datos, y de un número elevado de casos o tamaño muestral. Sin embargo, el enfoque de Wold era mucho más ligero, y a la práctica ausencia de hipótesis sobre la distribución de los datos se unía la ventaja de que un reducido número de casos podía ser suficiente para usar el algoritmo. Esta era la razón de que al enfoque de Wold se le denominara Soft Modeling o aproximación blanda.

Ambos enfoques sobre los modelos de rutas o modelos de ecuaciones estructurales fueron comparados por ambos en 1982 en “Soft Modeling: The basic Design and Some Extensions” en Systems under Indirect Observation - Causality Structure Prediction. La gran conclusion de dicha comparación es que, realizando algunos cambios en el algoritmo LISREL de

443

Page 4: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la Probabilidad y la Estadística (IV)

Jôreskog, las estimaciones dadas por ambos enfoques están correladas, aunque con el algoritmo original se conseguían estimaciones más robustas que con el método PLS.

Años más tarde de esta publicación, y en vista de la gran difusión que tuvo el enfoque PLS, Harald Martens propuso llamar PLS-Path Modeling al enfoque PLS sobre modelos de ecuaciones estructurales.

Uno de los problemas que surgen en modelos de ecuaciones estructurales (SEM) es su indeterminación. Es decir, existe un número de parámetros a estimar demasiado grande para el tamaño muestral de trabajo. Esto es debido principalmente a que las variables latentes son totalmente desconocidas e introducen una fuerte deficiencia en el modelo a la hora de medir las relaciones existentes entre ellas. Mediante PLS, este problema es resuelto de una forma muy sencilla, creando simplemente las variables latentes como sumas ponderadas de las variables manifiestas correspondientes. Esto permite dos cosas; una: resolver, como decíamos, la indeterminación del modelo al tener las variables latentes, y otra: poder analizar las puntuaciones obtenidas en dichas variables latentes. Esto último resulta muy interesante para las compañías, ya que cada variable latente suele reflejar un proceso de percepción de ellas, y poder compararla con las de la competencia es siempre deseable.

La metodología PLS-Path Modeling presupone que los modelos estructurales son lineales, por lo que cualquier técnica de regresión es susceptible de ser usada para la estimación de los coeficientes estructurales. Sin embargo, el método de regresión por mínimos cuadrados ordinarios es el más extendido debido a la falta de requisitos para su aplicación. De esta forma, la medida usada de bondad del ajuste es la propia de este tipo de modelos: el coeficiente de determinación R2, esto es, el cociente entre la variabilidad explicada por la regresión y la variabilidad total.

Referencias de Algoritmos de la Regresión PLS

En primer lugar hay que diferenciar el caso en el que la variable explicativa Y es univariante y el caso de cuando es multivariante, ya que existen dos métodos para la Regresión PLS, PLS1 y PLS2, adaptados a estas circunstancias. En la Regresión PLS 1 hay tan sólo una variable a explicar y p explicativas, mientras que en la Regresión PLS2 hay q variables a explicar (q>l) y p variables explicativas.

Existen muchos algoritmos de regresión PLS en la actualidad, pero sin duda alguna, el más útil para PLS-Path Modeling es el algoritmo NIPALS. Este algoritmo fue creado, como ya hemos referido, por Herman Wold en 1966 y ofrece la gran ventaja de no necesitar ni suprimir ni estimar los datos que sobran o faltan de una observación para que se pueda usar en el análisis. Su denominación se debe a que permite estimar los parámetros de un modelo no lineal mediante una serie de regresiones simples entre los datos y una parte de los parámetros, de ahí su nombre NIPALS (Nonlinear estimation by Iterative Partial Least Squares) que en español quiere decir algoritmo no lineal de estimación por mínimos cuadrados parciales iterados.

Sin duda alguna, el autor que de una forma más clara expone el algoritmo para esta técnica es Claes Fomell en su obra “A Second generation o f multivariate Análisis Vol F . A diferencia de otros autores como Lôhmoller, Wold o Tenenhaus, Fomell se centra en la aplicabilidad del método en lugar de en la teoría matemática subyacente a dicho método. Para la mayoría de los investigadores este enfoque es el más útil, puesto que tanto la notación como el desarrollo matemático de otros enfoques es bastante engorroso y poco aclaratorio sobre el procedimiento que sigue el método. Por ello, tomaremos como referencia el

444

Page 5: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la P robabilidad y la Estadística (IV)

algoritmo ofrecido por Fomell en la obra mencionada para ilustrar el algoritmo PLS-Path Modeling.

Otro algoritmo que cabe destacar es el elaborado por Claes Fomell para estudios de Satisfacción. Dicho algoritmo convierte las variables (siempre medidas en una escala 1-10) a una escala 0-100. Fomell ha logrado con este enfoque medir la economía estadounidense en términos de Satisfacción. De hecho, su metodología es la que se sigue en la actualidad en la medición de activos intangibles.

Una de las grandes ventajas que ofrece para el investigador la técnica PLS-Path Modeling es la simplicidad en la lectura y diagnosis del modelo (en comparación con otras técnicas). Esta simplicidad no excluye la modelización necesaria para cualquier estudio estadístico, pero sí que ayuda a la hora de reducir el tiempo de aprendizaje para el investigador, puesto que se detiene más que en consideraciones técnicas o algorítmicas en su aplicación a problemas o situaciones.

Evolución del software para el modelo PLS

El Dr. FL Martens, quién diseñó el primer paquete de software para PLS a mediados de los ochenta, propuso la idea y la aplicación de una forma avanzada de PLS que se designó L-PLS. Con el uso de PLS se pueden conectar entre sí datos de distinta índole: atributos de un producto, datos de preferencias y datos demográficos de los consumidores. Si se combinan estos grupos de datos, podemos obtener un mapa de preferencias que describa como se interrelacionan los atributos, los datos de preferencias y los datos demográficos de los consumidores: como edad, estatus económico o género. De este modo, podemos averiguar el grupo de consumidores que aceptaría un nuevo producto y modificar o diseñar un producto que satisfaga los gustos de un grupo de consumidores objetivo. Por supuesto el L-PLS también puede analizar otras combinaciones.

La disponibilidad de software para llevar a cabo un análisis PLS es limitada. Durante años el único software disponible para esta modelización flexible de la técnica PLS, PLS-Path Modeling, fue LVPLS 1.8 elaborado por Jan Bemd Lohmoller (1984). El propio Lohmoller tuvo su gran aportación en “Latent Variable Path Modeling with Partial Least Squares” en 1989, donde amplió las bases del algoritmo PLS en varias direcciones.

Más recientemente han aparecido nuevos programas comerciales, en versión para Windows, como PLS-Graph de Wynn Chin (Chin, 2004), profesor de la Universidad de Houston, con un interfaz intuitivo y amigable, siendo el profesor Wynne Chin la persona que está liderando este proyecto. PLS-Graph ha sido ya empleado en diversos trabajos de investigación.

También, en versión para Windows, existen aplicaciones gratuitas como SmartPLS o Visual PLS (versión gráfica del programa de Lohmoller), un interfaz gráfico muy sencillo de usar y muy intuitivo, totalmente disponibles en Internet. Este último diseñado por Jen Ruei Fu, profesor de la Universidad taiwanesa de Kaohsiung. La principal ventaja de esta herramienta es que es totalmente gratuita y su fiabilidad ha sido bien contrastada. Visual-PLS puede ser descargado de la página, http://www2.kuas.edu.tw/prof/fred/vpls/

La limitada difusión de los programas para PLS, junto con el carácter difícil y poco amigable que posee LVPLS, ha sido lo que ha llevado a lo no muy amplia difusión de la metodología PLS con relación a la otra rama de los modelos de ecuaciones estructurales (SEM). Sin embargo, creemos que cada vez más se está ampliando la base de investigadores

445

Page 6: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la Probabilidad y la Estadística (IV)

que están aplicando esta técnica, a lo cual contribuirá la distribución de PLS-Graph. Para más información se puede consultar la dirección de Internet: http://disc- nt.cba.uh.edu/chin/indx.html.

Finalmente, podemos avanzar el desarrollo de otros programas que permiten implementar este tipo de modelización flexible. Prueba de ello, son las últimas demostraciones realizadas en el 3rd International Symposium on PLS and Related Methods (Lisboa, 2003): http://www.isegi.unl.pt/pls03/default.htm

La técnica PLS en las Ciencias Sociales

El enfoque del Modelo de Ecuaciones Estructurales o SEM (Structural Equation Modeling) basado en las covarianzas (especialmente bajo la estimación de máxima verosimilitud) busca encontrar parámetros invariantes estructurales o funcionales que definan cómo funciona el mundo, es decir, persiguen proporcionar una afirmación de causalidad, una descripción de los mecanismos causales (modelización firme o rígida). El problema que surge al intentar alcanzar este conocimiento con estas técnicas son las hipótesis restrictivas que se requieren. Las distribuciones de los datos y los niveles de medida de las variables se pueden encontrar dentro de lo que se define como un sistema cerrado (Falk y Miller, 1992).

Sin embargo, dados estos requerimientos, parece difícil la aplicación estricta de este tipo de modelización en el campo de las ciencias sociales. En esta situación surge PLS, técnica que tal y como fue diseñada refleja las condiciones teóricas y empíricas de las ciencias sociales y del comportamiento, donde son habituales las situaciones con hipótesis teóricas no suficientemente asentadas y escasa información disponible (Wold, 1979).

PLS representa un tipo de sistema de análisis matemático y estadístico de datos que se adecúa a las condiciones presentes en las ciencias sociales. En esta forma de modelización, conocida como modelización flexible (Wold, 1980) los procedimientos matemáticos y estadísticos subyacentes en el sistema son rigurosos y robustos (Wold, 1979) y, sin embargo, el modelo matemático es flexible en el sentido de que no realiza suposiciones relativas a niveles de medida, distribuciones de los datos y tamaño muestral. El objetivo que se persigue es más moderado que la modelización firme.

En la modelización flexible se crean relaciones predictivas lineales óptimas entre variables. “En un sentido de mínimos cuadrados, esto significa que dados los datos y el modelo, las variables independientes se vuelven las mejores variables predictoras posibles, y las variables dependientes se vuelven las mejores variables criterio o predecidas" (Falk y Miller, 1992, p. xi). Como se observa, se abandona la idea de causalidad (presente en la modelización firme) y se reemplaza por el concepto de predictibilidad. Mientras que la causalidad garantiza la capacidad de controlar los acontecimientos, la predictibilidad permite sólo un limitado grado de control (Falk y Miller, 1992).

Podemos constatar que la modelización flexible es un método para estimar la probabilidad de un acontecimiento en función de la información disponible sobre otros acontecimientos. No pretende ser un sistema de valoración de la causalidad, pero es particularmente aplicable cuando no se producen las condiciones de un sistema cerrado.

Bagozzi fue uno de los primeros autores que planteaba el uso de técnicas PLS para los modelos de Satisfacción desde un punto de vista de negocio o marketing. Tras él, vinieron otros como Claes Fomell, referido anteriormente, o Anders Westlund que desarrollaron una metodología propia para los estudios de Satisfacción y que incluía desde la fase cualitativa (en

446

Page 7: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la P robabilidad y la Estadística (IV)

la que se obtienen los atributos o variables que conforman el cuestionario) hasta la interpretación de los resultados. Los estudios de Satisfacción suponen actualmente un gran marco de referencia en la Investigación de Mercados de la empresa moderna, y en su estrategia de relación con el cliente.

Sin embargo, la solución que ofrece PLS a la indeterminación del modelo tiene un precio; los estimadores de los parámetros no son consistentes y aparece un sesgo en sus estimaciones. Recordar que el estimador de un parámetro es consistente si se aleja del parámetro con una probabilidad débil, si el tamaño de la muestra es lo suficientemente grande. En realidad el precio que tenemos que pagar es relativamente pequeño, ya que si bien no se logra en principio la consistencia, sí está probada la consistencia cuando el tamaño muestral es suficientemente grande, es decir, la consistencia es asintótica. En los modelos SEM, la consistencia está asegurada si las hipótesis que se imponen se cumplen, lo cual es realmente extraño en la realidad. En cualquier caso, la consistencia es un propiedad asintótica tanto en modelos SEM, como en modelos PLS o de otro tipo, por lo que es sólo una cuestión de tamaño muestral. Wold siempre defendió el uso de técnicas no paramétricas para la evaluación de la consistencia en los modelos PLS.

En resumen, las mínimas exigencias en la distribución de la población y el tamaño muestral del modelo PLS han ocasionado que éste se popularice mucho entre los investigadores de administración de empresas, sobre todo por las muchas ventajas que presenta frente las técnicas basadas en la covarianza.

Bibliografía

Barclay, D.; Higgins, C.; Thompson, R. (1995): “The Partial Least Squares (PLS) Approach to Causal Modelling: Personal Computer Adoption and Use as an Illustration”, Technology Studies, Special Issue on Research Methodology, 2(2): 285-309.

Caballero Domínguez, Antonio Jesús. “SEM vs. PLS: Un enfoque basado en la práctica”, IV Congreso de Metodología de Encuestas. Universidad Pública de Navarra. Septiembre 2006

Chin, W.W. (1998b): “The Partial Least Squares Approach to Structural Equation Modelling”, en G. A. Marcoulides [ed.]: Modem Methods for Business Research, pp. 295- 336. Mahwah, NJ: Lawrence Erlbaum Associates, Publisher.

Chin, W.W.& Newsted, P.R. (1999): “Structural Equation Modelling Analysis with Small Partial Least Squares”, en R. Hoyle [ed.]: Statistical Strategies for Small

Chin, W. W., (2000). Frequently Asked Questions - Partial Least Squares & PLSGraph. Home Page.[On-line]. Available: http://disc-nt.cba.uh.edu/chin/plsfaq.htm

Chin. W.W.; (2004): PLS-Graph. Version 3.00. build 1060. University of Houston, Texas, USA.

Edwards, J. R., & Bagozzi, R. P. (2000): “On the nature and direction of relationships between constructs and measures”, Psychological Methods, 5(2): 155-177.

Efron, B. (1982): The Jackknife, The Bootstrap and Other Resampling Plans. Philadelphia: Society for Industrial and Applied Mathematics.

Efron, B. & Gong, G. (1983): “A Leisurely Look at the Bootstrap, the Jackknife, and Cross- Validation”, The American Statistician, 37: 36-48.

447

Page 8: La regresión por mínimos cuadrados parciales: orígenes y evolución · 2020. 4. 19. · El problema de la multicolinealidad, o relación de dependencia extrema entre variables

H istoria de la Probabilidad y la Estadística (IV)

Falk, R.F. & Miller; N.B. (1992): A Primer for Soft Modelling. Akron, Ohio: The University of Akron.

Fornell, C. (1982): “A Second Generation of Multivariate Analysis: An Overview”, en C. Fomell [ed.]: A Second Generation o f Multivariate Analysis, 1: 1-21. New York: Praeger Publishers.

Fornell, C. & Bookstein, F.L. (1982): “A Comparative Analysis of Two Structural Equation Models: Lisrel and PLS Applied to Market Data”, en C. Fomell [ed.]: A Second Generation o f Multivariate Analysis, 1: 289-324. New York: Praeger Publishers.

Frank, I.E., & Friedman, J.H. (1993): “A statistical view of chemometrics regression tools”. Technometrics, 35, 109-148.

JÔRESKOG, K.G. & WOLD, H. (1982): Systems under Indirect Observation - Causality Structure Prediction. Amsterdam: North Holland Publishing Company.

JÔRESKOG K a r l G. (1993). Modelado de ecuaciones estructurales con LISREL. Instituto Vasco de Estadística.

Jôreskog, Karl G & Sôrbom, Dag. (1993). LISREL 8. Structural Equation Modelling with the Simplis Command Language. Lawrence Erlbaum Associates Publishers.

Jôreskog, Karl G & Sôrbom, Dag. 1993. LISREL 8 y PRELIS 2. User's Reference Guide. SSL Scientific Software International.

LOHMOLLER, J.B. (1984): LVPLS Program Manual. Version 1.6. Latent Variables Path Analysis with Partial Least-Squares Estimation. Kôln: Zentralarchiv fur Empirische Sozialforschung, Universitât zu Kôln.

Wold, H. (1966): “Estimation of principal components and related models by iterative least squares”. In P.R. Krishnaiaah (Ed.). Multivariate Analysis, (pp.391-420) New York: Academic Press.

Wold, H. (1973): “Nonlinear Iterative Partial Least Squares (NIPALS) Modelling: Some Current Developments”, en P.R. Krishnaiah [ed.]: Multivariate Analysis: II, Proceedings of an International Symposium on Multivariate Analysis Held at Wright State University, Dayton, Ohio, June 19-24, 1972, pp. 383-407. New York: Academic Press-

W OLD, H. (1979): “Model Construction and Evaluation when Theoretical Knowledge Is Scarce: An Example of the Use of Partial Least Squares”. Cahiers du Département D'Econométrie. Genève: Faculté des Sciences Economiques et Sociales, Université de Genève.

Wold, H. (1980): “Soft Modelling: Intermediate Between Traditional Model Building and Data Analysis”, Mathematical Statistics, 6: 333-346.

Wold, H. (1982): “Systems Under Indirect Observation Using PLS”, en C. Fomell [ed.]: A Second Generation o f Multivariate Analysis, 1: 325-347. New York: Praeger Publishers.

Wold, H. (1985): “Systems Analysis by Partial Least Squares”, en P. Nijkamp, H. Leitner y N. Wrigley [ed.]: Measuring the Unmeasurable, pp. 221-251. Dordrecht: Martines Nijhoff Publishers.

Wold H. (1985): “Partial Least Squares”, in S. Kotz and N. L. Johnson (Eds.), Encyclopedia o f Statistical Sciences (vol. 6), New York: Wiley, pp. 581-591.

Wold, S. (2001): “Personal memories of the early PLS development”. Chemometrics and Intelligent Laboratory Systems, 58, 83-84.

448