Protocolo 4. Metodolog´ıa para la reconstrucci´on de series de velocidad y direcci´on de viento Universidad de los Andes - Consejo Nacional de Operaciones (CNO) Junio 2018
´Indice 1. Protocolo 1.1. Pre-procesamiento y evaluaci´ on de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Aplicaci´ on modelo MCP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 3
2. Introducci´ on
3
3. Descripci´ on algoritmos MCP 3.1. Clima e´ olico y correlaci´ on de series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. M´etodos MCP de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Incorporaci´ on de direcci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 6 7 8
4. Descripci´ on modelo implementado
9
1.
Protocolo
Como complemento a las diferentes metodolog´ıas propuestas en cumplimiento de lo dispuesto en la resoluci´ on CREG 167 de 2017, este documento presenta el Protocolo 4. Metodolog´ıa para la reconstrucci´ on de series de velocidad y direcci´ on de viento. Variables requeridas en el modelo de estimaci´on de generaci´ on energ´etica, asociado al tercer producto entregado y denominado Protocolo 2. Modelo energ´ etico para parques e´ olicos. Como parte integral de la metodolog´ıa propuesta se asume que los datos utilizados fueron adquiridos de acuerdo a lo dispuesto en el Protocolo 1. Gu´ıa de buenas pr´ acticas y requerimientos m´ınimos de medici´ on. Este protocolo est´ a compuesto por dos secciones. La primera corresponde al pre-procesamiento de los datos y la corroboraci´ on de su aplicabilidad para el prop´ osito del modelo. El segundo describe el modelo de reconstrucci´ on hist´ orica y define el procedimiento previo a su aplicaci´on, el soporte te´orico se presenta en la secci´on 3.3.
1.1.
Pre-procesamiento y evaluaci´ on de datos
Llenado de datos Como se mencion´ o anteriormente este protocolo asume que los datos utilizados para su ajuste fueron adquiridos siguiendo la gu´ıa de buenas pr´ acticas y requerimientos m´ınimos de medici´on. Sin embargo, es posible que exista p´erdida de informaci´ on asociada a imprevistos en las campa˜ nas. El c´alculo de la ENFICC requiere de una caracterizaci´ on de la generaci´ on energ´etica mensual. Debido a esto, es importante contar con suficientes datos que permitan, de manera razonable, estimar la disponibilidad durante un mes dado. En l´ınea con lo anterior,
1
las p´erdidas de informaci´ on est´ an limitadas a m´aximo el 5 % del total de la informaci´on requerida, establecida en la resoluci´ on CREG 167 de 2017, como un a˜ no de mediciones en resoluci´on de 10 minutos. Este porcentaje se traduce en 18.25 d´ıas que no podr´ an en ning´ un caso distribuirse en m´as de dos semanas continuas. El llenado de datos podr´ a realizarse haciendo uso de informaci´on redundante adquirida en la misma torre, torres de medici´ on cercanas y en caso de no cumplir con las restricciones de los dos casos anteriores, a trav´es de la aplicaci´ on de procedimientos estad´ısticos. Se entiende como informaci´on redundante, informaci´on proveniente de un instrumento localizado en la misma torre, ya sea a la misma altura o en una altura inferior. Si este es el caso, el llenado se debe realizar escogiendo una de las siguientes opciones: 1. Si ambos instrumentos se encuentran a la misma altura, se toman los datos faltantes directamente de los registros del instrumento redundante. 2. Si el instrumento redundante se encuentra a una altura inferior, debe aplicarse una de las t´ecnicas de extrapolaci´ on por altura recomendadas en el Protocolo 3. T´ ecnicas recomendadas para extrapolaci´ on por altura Si la campa˜ na cuenta con m´ as de una torre de medici´on, es posible realizar un llenado de los datos a partir de informaci´ on de la torre m´ as cercana. Esta deber´a encontrarse en el radio o en el l´ımite del radio de representatividad (= 10 a˜ nos), y por consiguiente su capacidad de generaci´ on energ´etica. Para el caso de velocidad de viento y dem´as variables asociadas a la
3
producci´ on de energ´ıa e´ olica, la industria utiliza en la mayor´ıa de los casos dos familias de metodolog´ıas: 1. Estad´ısticas y de an´ alisis de datos encabezadas por los modelos MCP, (por sus siglas en ingl´es, Measure Correlate Predict) [5], y 2. Modelos f´ısicos m´ as complejos basados en NWP (por sus siglas en ingl´es, Numerical Weather Prediction), caso espec´ıfico de WAsP. Los primeros modelos MCP se propusieron alrededor de 1940 y estuvieron especialmente dirigidos a la estimaci´ on de velocidad de viento promedio de largo plazo para una locaci´on determinada. Este tipo de metodolog´ıas se populariz´ o en los 90s con una gran aparicipon de m´etodos tan simples o complejos como requiera la aplicaci´ on de la informaci´ on generada. A partir de los modelos m´as b´asicos se han hecho modificaciones y aportes para mejorar su operaci´ on, i.e. uso de varias fuentes de informaci´on, diferentes formas de estimar la direcci´ on de viento, estimaciones independientes de velocidad y direcci´on, generaci´on sint´etica de datos y un gran numero de aproximaciones estad´ısticas. Las publicaciones m´as recientes hacen uso de modelos de aprendizaje de m´aquina, redes neuronales e inteligencia de datos, entre otros, aunque con buenos resultados estos no son com´ unmente usados en la industria e´ olica.
3.
Descripci´ on algoritmos MCP
Los modelos MCP utilizan informaci´ on medida en sitio e informaci´on secundaria para establecer el comportamiento hist´ orico de ciertas variables, la figura 1 muestra el detalle de las variables de entrada y ejemplifica los resultados obtenidos a partir de este tipo de modelos. Su correcta aplicaci´on requiere informaci´on de corto plazo medida en sitio e informaci´ on de largo plazo correspondiente a la fuente secundaria seleccionada (> 10 a˜ nos). Es importante asegurar que la informaci´on de largo plazo tenga un periodo com´ un con la informaci´ on de corto plazo medida en sitio por al menos un a˜ no. En adelante al hacer referencia a la informaci´on de corto y largo plazo se utilizaran las siglas CP y LP , respectivamente. En cuanto a la informaci´on de referencia o secundar´ıa se utilizara el sub´ındice r, asociado a referencia, mientras que para la informaci´on asociada al punto de medici´ on se utilizar´ a el sub´ındice o, asociado a objetivo. La aplicaci´ on de este tipo de modelos se basa en cuatro grandes supuestos: 1. la informaci´ on de CP medida en sitio fue adquirida siguiendo procedimientos de calidad y no est´a afectada por obst´ aculos cercanos capaces de distorsionar la relaci´on entre series de datos. 2. la ubicaci´ on de la torre as´ı como las alturas de medici´on no deben sufrir cambios durante el periodo de medici´ on establecido. 3. la altura a la que se miden los datos en sitio y la altura de la informaci´on de referencia deber´an ser tan similares como sea posible. 4. una vez verificadas las anteriores restricciones, las dos series CP (medidas en sitio y fuente secundaria) deber´ an presentar el mismo clima e´ olico. Comprobado a trav´es de la correlaci´on existente entre ambas series de tiempo. Como se mencion´ o anteriormente existe una gran variedad de metodolog´ıas y algoritmos MCP. Algunos muy simples que buscan estimar valores de velocidad promedio anual y que en general establecen simples proporciones entre las series utilizadas; hasta aquellos con metodolog´ıas de ajuste complejas como modelos autorregresivos optimizados a trav´es de m´etodos num´ericos. La selecci´on del algoritmo depende de la aplicaci´on especifica de la informaci´ on pronosticada o reconstruida y el grado de confiabilidad requerido. Para la evaluaci´ on energ´etica de parques e´ olicos, la industria e´olica en su mayor´ıa utiliza modelos basados en regresiones lineales de primer orden. Diferentes variaciones esta familia de modelos est´an disponibles en paquetes comerciales como WindPro o WindoGrapher. El modelo de parque utilizado en la estimaci´ on de generaci´on energ´etica mensual durante un periodo igual a 10 a˜ nos, asume la disponibilidad de velocidad y direcci´on de viento para el mismo punto o dos puntos cercanos entre ellos (al menos 10 km) y entrega series de velocidad y direcci´on de viento estimadas de forma conjunta durante el periodo hist´ orico disponible. La resoluci´on de la informaci´on podr´a ser cada 10 minutos u horaria dependiendo de la base de datos utilizada para la extrapolaci´on temporal. La metodolog´ıa b´asica de los modelos MCP se presenta en la figura 2. En esta se asume que la informaci´on de entrada es adecuada para el prop´ osito ´ del ajuste. Unicamente es necesario implementar una t´ecnica de extrapolaci´on por altura para asegurar que los
4
Figura 1: Variables de entrada modelo MCP datos medidos en sitio y la informaci´ on de referencia se encuentran a la misma altura. De acuerdo con Probst y C´ ardenas citados en [3], esto disminuye el error asociado a la estimaci´on de largo plazo. A manera de ejemplo si la velocidad medida en sitio se encuentra a una altura de 40 m y la velocidad de referencia a 10 m se debe aplicar una t´ecnica de extrapolaci´ on por altura para la serie de 10 m. Los pormenores del calculo de par´ametros para la correcta aplicaci´ on de esas t´ecnicas se detallan en el protocolo n´ umero 3 de esta serie de entregables. Tambi´en se considera el caso en el que la serie de referencia pueda ser obtenida a alturas mayores, escenario en el que se debe seleccionar la altura m´ as cercana posible a la altura de medici´on y ejecutar un modelo de extrapolaci´ on para igualar la altura de referencia de ambas series de datos. El siguiente paso en la figura 2 es establecer la correlaci´on entre series para el periodo com´ un disponible. Esto se realiza aplicando la ecuaci´ on 5 a la serie de datos o calculando el coeficiente de Pearson con un paquete comercial y verificando que este sea superior a 0.83. Una vez establecida la existencia de correlaci´ on entre las series, se realiza el ajuste del modelo de correlaci´ on, tercer paso mostrado en la figura 2. En la literatura se han propuesto gran variedad de modelos de correlaci´ on entre la variable independiente (serie de referencia VrLP ) y la variable dependiente (serie objetivo VoLP ). Los modelos m´ as simples conocidos como m´etodos de proporci´on o Ratio Methods, suponen que la pareja de series de datos se relacionan a trav´es de un coeficiente tal que logre corregir los errores por desviaci´on. En este grupo se encuentran, por ejemplo: M´etodo de Putnam 1948, (Climatological reduction by the method of ratios) en el que se establece una proporci´ on de medias de la velocidad para la serie de referencia y la serie objetivo seg´ un la ecuaci´on 3. LP
M´etodo de Corotis 1977, utilizado para estimar la velocidad promedio de largo plazo (V o ).En esta propuesta se adiciona la correlaci´ on cruzada de largo plazo rLT seg´ un la ecuaci´on 4, los valores SoCP ySrLP , son la desviaci´ on est´ andar de la la serie objetivo y serie de referencia. ST Vo LT (V t )o = (Vt )LT (3) r ST Vr LT ST ST LT = V o + rLT V r − V r St /SoST (4) (V t )LT o La u ´ltima etapa del proceso es predecir el comportamiento de largo plazo en el punto de inter´es. Ya sea estimar la velocidad promedio caracter´ıstica o reconstruir el comportamiento hist´orico punto a punto, inter´es particular de este documento. El pron´ ostico punto a punto ser´a entonces el resultado de aplicar el modelo de ajuste (paso anterior) a la serie de largo plazo (>= 10 a˜ nos). 5
Figura 2: Diagrama de bloques modelos MCP Esta secci´ on se incluy´ o en el documento como ejemplo para aquellos lectores que no se encuentran familiarizados con el procedimiento descrito, ya que el prop´ osito de este documento no es realizar una revisi´on detallada de los modelos conocidos, se recomienda la revisi´on de la referencia [3].
3.1.
Clima e´ olico y correlaci´ on de series
Tres de las cuatro suposiciones mencionadas en la secci´on 3 se cumplen siguiendo los requerimientos de medici´ on establecidos en el primer entregable asociado a buenas pr´acticas y requerimientos m´ınimos de medici´on. El cuarto y m´ as fuerte supuesto es asegurar que las series de datos representan adecuadamente el clima e´olico en el ´ area de inter´es. Este comportamiento se verifica a trav´es de una buena correlaci´on entre la informaci´on de referencia y la informaci´ on objetivo. Otros tipos de validaciones son u ´tiles para el usuario de esta herramienta, por ejemplo la comparaci´ on de los patrones diarios, anuales y las rosas de viento de ambas series de datos. Se espera que estos coincidan entre las diferentes fuentes de informaci´on. T´ıpicamente el nivel de correlaci´ on es cuantificado como el Coeficiente de Correlaci´on de Pearson (r), calculado para la pareja de datos durante el periodo com´ un [6, 5, 3]. Es importante resaltar que r es un indicador de la dependencia lineal de las series y no explica en si mismo la correlaci´on f´ısica existente. De acuerdo con el manual de usuario de la herramienta MCP de WindPro [6], el nivel de correlaci´on puede ser categorizado seg´ un la tabla 1, donde 1 corresponde a variables con correlaci´on positiva total. El limite inferior aceptado para este coeficiente se estableci´ o como 0.83 en la resoluci´on CREG 167 de 2017 y se calcula seg´ un la ecuaci´on 1. Este valor es equivalente a la ra´ız del coeficiente de determinaci´on de una regresi´on lineal en la que R2 es igual a 0.7.
6
Tabla 1: Categor´ıas de correlaci´ on asociadas al coeficiente de Pearson, tabla realizada por los autores con base en la referencia [6] Valor r Categor´ıa 0.5 − 0.6 Muy pobre 0.6 − 0.7 Pobre 0.7 − 0.8 Moderado 0.8 − 0.9 Bueno 0.9 − 1 Muy bueno
Este rango de valores se encuentra reportado en la literatura [5, 3]. ST ST ST ][(Vi )ST ] r − Vr i=1 [(Vi )o − Vo ST 2 1/2 Pn ST 2 1/2 ST ST ] ] i=1 [(Vi )r − Vr i=1 [(Vi )o − Vo
Pn
r = P n
3.2.
(5)
M´ etodos MCP de primer orden
Aunque los modelos de proporci´ on fueron utilizados ampliamente en la industria su aplicaci´on entr´o en deshuso con la aparici´ on de ajustes a trav´es de polinomios de primer orden de la forma y = βx + α como se muestra en la figura 3, actualmente disponibles en software comerciales. De acuerdo con la referencia [3] las aproximaciones m´ as comunes son las regresiones lineales ordinarias (OLR), regresiones ortogonales (OR) y las regresiones por cuantiles (QR). Los valores de β y α son establecidos utilizando m´etodos como m´ınimos cuadrados o minimizaci´ on del estad´ıstico chi-cuadrado X 2 , entre muchas otras variaciones. Uno de los software comerciales m´ as
Figura 3: Regresi´ on lineal de la forma y = βx + α ajustada a partir de informaci´on medida en sitio e informaci´ on obtenida de ENREL en resoluci´ on horaria. utilizados en la industria e´ olica es WindoGrapher, ´este cuenta con varias aproximaciones para la reconstrucci´ on hist´ orica de informaci´ on. Se destacan los m´etodos SpeedSort, DynaSort, Scatter, todos desarrollados por King y Hurley 2005, y el m´etodo Variance Ratio propuesto por Rogers 2005. A diferencia de las aproximaciones a trav´es de regresiones lineales de diversas caracter´ısticas el m´etodo denominado DynaSort no ajusta la regresi´ on lineal directamente sobre el conjunto de datos seleccionado. La metodolog´ıa busca reducir la variaci´ on de los datos de velocidad de viento ordenados, pensando en el procedimiento para admitir direcci´ on como parte del ajuste. Antes de realizar la regresi´on correspondiente se realiza un suavizado a trav´es de una media m´ ovil tomando grupos de M datos seg´ un la ecuaci´on 6 [referencia 67]. PM +k (Vk+1 )CP o
=
CP j=i+k (Vj )o
M
PM +k ; (Vk+1 )CP r
7
=
CP j=i+k (Vj )r
M
(6)
Por su parte el m´etodo de Rogers o proporci´on de varianzas no ajusta una regresi´on lineal, este calcula los par´ ametros α y β seg´ un la ecuaci´ on 7. En esta aproximaci´on se tiene especial inter´es en asegurar que la varianza de los datos reconstruidos sea igual a la varianza de la informaci´on medida en sitio [2]. σ 2 (ˆ y ) = σ 2 (βx + α) = σ 2 (βx) + σ 2 (α) = β 2 σ 2 (x)
(7a)
2
σ (ˆ y) σ 2 (x) σy β= σx σy α = µy − µx σx β2 =
3.3.
(7b) (7c) (7d)
Incorporaci´ on de direcci´ on
En l´ınea con la aplicaci´ on final de los datos, estimaci´on de generaci´on energ´etica, es necesario que el protocolo de reconstrucci´ on temporal aporte informaci´ on de direcci´on de viento, utilizada en la estimaci´on del efecto de estela para las diferentes turbinas que componen el parque. La mayor´ıa de los modelos que incorporan la direcci´on de viento en el proceso de reconstrucci´on, utilizan una clasificaci´ on de dos niveles (velocidad y direcci´ on) para la creaci´on de dos matrices, t´ıpicamente, de igual tama˜ no como se muestra en la figura 4 [4, 3]. Este procedimiento de clasificaci´on se realiza para el periodo com´ un entre las series (regi´ on sombreada en la figura 1). Las matrices resultantes, una para informaci´on de referencia y
Figura 4: Esquema general para modelos con inclusi´on de direcci´on, matrices de igual tama˜ no y sectores de direcci´ on constantes, figura elaborada por los autores con base en [3] . otra para informaci´ on objetivo, se presentan como el porcentaje de datos que se clasificaron en la ”clase” o ”bin” correspondiente. En la tabla 2 se presenta a manera de ejemplo la clasificaci´on de una serie de viento en dos niveles como funci´ on de su direcci´ on y el rango de velocidades reportadas. En esta es evidente que la concentraci´ on de datos se encuentra en la clase 45◦ a 100◦ que incluye la direcci´on dominante de viento (83◦ ) reportada para los datos del caso de estudio. En esta nivel de direcci´on se concentra el 88.3 % de los datos de viento, especialmente en los niveles entre 5m/s y 9m/s como se muestra en la figura 5.
8
Tabla 2: Matriz ejemplo para clasificaci´on de dos niveles, desarrollada por los autores Direcci´on (◦ ) rango 0-50 50-100 100-120 120-160 160-240 240-360 0a3 0.1 5.8 1.8 1.7 1.9 1.0 3a5 0.1 13.5 2.1 0.9 0.0 0.0 Velocidad 5a7 0.1 26.4 0.5 0.0 0.0 0.0 (m/s) 7a9 0.1 31.2 0.0 0.0 0.0 0.0 9 a 11 0.0 11.4 0.0 0.0 0.0 0.0 11 a 13 0.0 0.0 0.0 0.0 0.0 0.0 13 a 18 0.0 0.0 0.0 0.0 0.0 0.0 18 a 25 0.0 0.0 0.0 0.0 0.0 0.0
Una vez calculadas las dos matrices descritas, se ejecuta alguna de las metodolog´ıas propuestas en las secciones ?? y 3.2, esta vez para cada una de las clases de forma independiente y no para toda la serie de datos. Se tendr´ an entonces N n´ umero de ajustes como combinaciones de niveles se tengan. Para el ejemplo presentado se tienen 8 categor´ıas en el nivel 1 (velocidad) y 6 categor´ıas en el nivel 2 (direcci´on), el total de ajustes requeridos para este caso en menor o igual a 48. Una buena forma de agrupar la velocidad de viento es establecer el primer bloque de datos entre 0 y la velocidad de arranque de los equipos, 3m/s o 4m/s, y el u ´ltimo bloque entre una velocidad posterior a la nominal y la velocidad de desconexi´on de los equipos. Los modelos con incorporaci´ on de direcci´ on tienen entonces tres factores determinantes en el momento de su aplicaci´on: 1) cantidad y l´ımites de los sectores de direcci´ on utilizados; 2) cantidad y limites de clasificaci´on de velocidad y 3) tipo de ajuste por aplicar en cada uno de los sectores definidos a trav´es de la clasificaci´on de dos niveles. El procedimiento descrito
Figura 5: Comparaci´ on tendencia de agrupaci´on de datos por direcci´on y velocidad. Figura elaborada por los autores haciendo uso de informaci´ on medida en sitio. . a continuaci´ on est´ a dividido en dos bloques. El primero corresponde al tratamiento de la informaci´on de entrada, espec´ıficamente llenado de datos (vac´ıos m´ aximos 5 % del total requerido, no superior a dos semanas continuas) y al calculo de coeficiente de correlaci´ on que garantice que el conjunto de series se encuentra sometido al mismo clima e´ olico. En el segundo bloque se describe le metodolog´ıa seleccionada.
4.
Descripci´ on modelo implementado
Tras la breve revisi´ on de literatura presentada en las secciones anteriores se seleccion´o el modelo de Rogers con algunas consideraciones en la selecci´ on de los l´ımites de direcci´on y velocidad de viento. La primera secci´ on del
9
modelo implementado permite al usuario comparar el patr´on anual del conjunto de datos, la rosa de vientos y calcular el coeficiente de correlaci´ on de Pearson. Los resultados obtenidos se presentan en las figuras 6, 5 y 8. La selecci´ on de los l´ımites del nivel de direcci´on se comprob´o siguiendo las tres tendencias t´ıpicas en la
Figura 6: Ejemplo de comparaci´ on de series hist´oricas y patrones anuales como parte de la herramienta programada .
Figura 7: Ejemplo para rosas de viento obtenidas como parte de la herramienta programada . literatura: establecer i) tama˜ nos fijos (i. e. 60◦ cada uno); ii) sectores con igual cantidad de datos (asociaci´ on de cuantiles 10:20:90, para los que el l´ımite inferior es 0 y el l´ımite superior es la velocidad de desconexi´ on de las turbinas) y; iii) sectores de tama˜ no variable (en este caso de acuerdo con la distribuci´on acumulada de los datos). Se aclara que el ajuste del modelo se realiz´o aplicando la 7 a cada pareja de datos agrupada. Se encuentra que todos los tres tipos de ajuste presentan un comportamiento adecuado seg´ un los errores reportados en la tabla 3. El ajuste obtenido manteniendo igual cantidad de datos en cada sector reporta el peor comportamiento. Dada la cantidad de informaci´on se recomienda utilizar entre 6 y 7 clases por nivel. Finalmente la figura 9 muestra el resultado obtenido con el modelo propuesto.
10
Figura 8: Ejemplo para correlaci´ on entre series, se presenta valor r para el conjunto de datos .
Figura 9: Ejemplo de reconstrucci´on de informaci´on para 2014 .
Tabla 3: Errores obtenidos bajo tres diferentes criterios de agrupaci´on por direcci´on Direcci´ on variable Sectores constantes Igual cantidad de datos RMSE 2.95 % 2.94 % 3.21 % Diferencia medias 0.75 % 0.12 % 6.75 % Ke 1.08 % 0.15 % 4.53 %
11
Referencias [1] D. Adams. The Hitchhiker’s Guide to the Galaxy. San Val, 1995. [2] James F. Manwell Anthony L. Rogers, StrackJohn W. Rogers. Comparison of the performance of four measure–correlate–predict algorithms. Journal of Wind Engineering and Industrial Aerodynamics, 93:243– 264, 2005. [3] Cabrera. Pedro Carta. Jos´e A, Vel´ azquez. Sergio. A review of measure-correlate-predict (mcp) methods used to estimate long-term wind characteristics at a target site. Renewable and Sustainable Energy Reviews, 27:362–400, 2013. [4] M. Strack G.Gerdes. Long-term correlation of wind measurement data. DEWI Magazin, 15:18–24, 1999. [5] New York State Energy Research and Development Authority. Wind resource assessment handbook. [6] WindPro. Energy - 11 mcp.
12