Documento descargado de http://www.elsevier.es el 10/11/2017. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Med Clin (Barc). 2011;137(2):73–76
www.elsevier.es/medicinaclinica
Artı´culo especial
El software libre en la investigacio´n me´dica The free software in medical research ˜ os b,*, Xurxo Hervada Vidal b Teresa Seoane Pillado a, Miguel A´ngel Rodrı´guez Muı´n c y Carmen Cadarso Sua´rez a
Unidad de Epidemiologı´a Clı´nica y Bioestadı´stica, Complejo Hospitalario Universitario A Corun˜a, A Corun˜a, Espan˜a Direccio´n Xeral de Sau´de Pu´blica e Planificacio´n, Consellerı´a de Sanidade, Xunta de Galicia, Santiago de Compostela, Espan˜a c Unidad de Bioestadı´stica, Facultad de Medicina, Universidad de Santiago de Compostela, Santiago de Compostela, Espan˜a b
´ N D E L A R T I´ C U L O INFORMACIO
Historia del artı´culo: Recibido el 8 de septiembre de 2009 Aceptado el 22 de octubre de 2009 On-line el 24 de diciembre de 2009
Un problema cla´sico a la hora de utilizar programas informa´ticos para la realizacio´n de estudios biome´dicos consiste en que asumimos el elevado coste del software propietariod, y no lo consideramos un handicap o un punto para tener en cuenta a la hora de evaluar su conveniencia. Esta situacio´n provoca un sesgo en el panorama del software especializado, y claramente inclina la balanza hacia el lado del software comercial. Adema´s del precio de ˜ adir su coste del la adquisicio´n de estos programas, hay que an mantenimiento. Casi todos los productos poseen una polı´tica de licencias1–4 que provoca que, anualmente, tengamos la necesidad de renovarlos (incluso no permiten continuar utilizando las versiones anteriores). En resumen, por un lado, a nivel empresarial, nos estamos acostumbrando a «arrendar» los paquetes de software que se utilizan habitualmente en la realizacio´n de estudios biome´dicos, y por otro lado, a nivel particular, utilizamos de forma fraudulenta («pirateo») el software empresarial (en el caso concreto que nos ocupa, se estima que el uso «pirata» que se realiza de este tipo de programas —sirva como ejemplo el SPSS— es de un 80% del total del software biome´dico). Una tarea importante, desde el punto de vista funcional, serı´a la de acometer la eliminacio´n de situaciones de dependencia tecnolo´gica generadas por este tipo de estrategias. Se debe
* Autor para correspondencia. Correo electro´nico:
[email protected] ˜ os). (M.A. Rodrı´guez Muı´n d El software propietario o privativo, tambie´n llamado de co´digo cerrado, se define como el software del que el usuario tiene limitada la posibilidad de usarlo, modificarlo, distribuirlo o disponer de su co´digo fuente por estar restringido por sus autores, ya sean personas fı´sicas o empresas; mientras que el software comercial es ˜ ı´as que lo producen cobran dinero para permitir su aquel por el que las compan utilizacio´n.
considerar la independencia del software de terceras partes, el acceso completo y abierto a sus funcionalidades y la posibilidad de ˜ adido a la hora modificacio´n/adaptacio´n de e´ste como un valor an de seleccionar las herramientas de referencia para la realizacio´n de estudios me´dicos, bioestadı´sticos, epidemiolo´gicos o de salud en general. Por otro lado, es necesario considerar que estamos viciando el propio sistema a la hora de elegir indiscriminadamente, desde un punto de vista econo´mico, los programas para utilizar, que estamos influyendo, de una manera indirecta, en las herramientas de software para futuros estudios y estamos delimitando el campo de accio´n de los estudiantes (futuros profesionales del sector) y los nuevos investigadores, y ası´ conseguimos marcar tendencias en la docencia y la investigacio´n, que vuelven a retroalimentar el bucle. Adema´s de todo esto, el panorama actual del software necesario para la realizacio´n de estudios de salud pasa por la necesidad de homogeneizar el entorno de trabajo, que hoy en dı´a consiste en la utilizacio´n de ma´s de un programa simulta´neamente y, en ciertos casos, un nu´mero elevado de ellos; algunos de e´stos esta´n disponibles en sistemas operativos distintos (como pueden ser, por ejemplo, Windows o Linux), y que aumentan, todavı´a ma´s, el coste indirecto imputado a la realizacio´n de este tipo de estudios, adema´s de crear un statu quo heteroge´neo que no favorece la evolucio´n de los sistemas de software ni la posibilidad de incorporacio´n de nuevas rutinas o programas de fa´cil acceso y utilizacio´n por parte de la comunidad cientı´fica. Veamos un ejemplo Un profesional sanitario quiere realizar un estudio clinicoepidemiolo´gico que consiste en evaluar el riesgo de una enfermedad en pacientes con cierta caracterı´stica comu´n. Para esto, lleva a cabo
˜ a, S.L. Todos los derechos reservados. 0025-7753/$ – see front matter ß 2009 Elsevier Espan doi:10.1016/j.medcli.2009.10.045
Documento descargado de http://www.elsevier.es el 10/11/2017. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
74
T. Seoane Pillado et al / Med Clin (Barc). 2011;137(2):73–76
un estudio epidemiolo´gico transversal descriptivo. Para realizar ˜ ada con el software este estudio recoge en una base de datos disen propietario y comercial «S» los datos de la muestra seleccionada; posteriormente realiza el ana´lisis estadı´stico con ese mismo programa comercial. Finalmente, el clı´nico recoge e interpreta los resultados obtenidos en un artı´culo con el fin de aportar informacio´n de intere´s para la comunidad cientı´fica. Adema´s de esto, el cientı´fico en cuestio´n elabora una presentacio´n con la que pueda comunicar en cierto congreso, de forma adecuada, la realizacio´n de este estudio y de los datos obtenidos en e´l. Para esto utilizara´ el software propietario y comercial «P». Para finalizar, el mismo investigador, esta vez en calidad de docente, aprovechara´ su estudio (y la presentacio´n de la comunicacio´n de e´ste) para explicarles a sus alumnos el trabajo cientı´fico realizado y los datos obtenidos, adema´s de formarlos en las te´cnicas adecuadas para la realizacio´n de ese tipo de estudios. Los alumnos adquieren el conocimiento de la utilidad del software «S» (y del software «P», colateralmente). En el futuro, cuando los alumnos pasen a formar parte de la comunidad cientı´fica, podra´n realizar sus propios estudios, para los que tendra´n como software de referencia los mencionados programas propietarios «S» y «P». En ese momento puede que se encuentren con alguno de estos 2 problemas, o con ambos: que necesiten adquirir licencias de los programas «S» y «P» o que no puedan modificar estos programas para realizar cierto tipo de ca´lculos que, a mayores, se necesiten en este caso concreto. Alternatinas al software propietario La alternativa al software comercial es el software libre5. Podemos definir «software libre» como aquellos programas de ordenador de los que disponemos del co´digo fuente y de la posibilidad, contemplada en la licencia de e´ste, de modificarlo o adaptarlo segu´n nuestras necesidades y poder redistribuirlo posteriormente6–13. Segu´n la definicio´n de la Free Software Foundatione, el software libre se refiere a la oportunidad de los usuarios para utilizar, distribuir y modificar el software sobre la base de 4 libertades14: la libertad de usar el programa, con cualquier propo´sito; de estudiar y adaptar el programa segu´n las necesidades de cada uno; de distribuirlo libremente, y de modificar el programa y hacer pu´blicas las modificaciones, de modo que toda la comunidad se beneficie. La forma de ofrecer un programa como software libre consiste en ponerlo a disposicio´n de la comunidad con una licencia anexa, de forma que el autor o autores de e´ste provean a los interesados una manera de realizar «actuaciones legales» sobre estos programas. Desde el punto de vista del software libre, existen distintos tipos de licencias. Una de las ma´s extendidas es la licencia GPLf (General Public License), cuya primera versio´n vio la luz en la de´cada de 1980. Esta licencia posibilita la utilizacio´n, la modificacio´n y la redistribucio´n del software y obliga a que siga mantenie´ndose este tipo de licencia en las versiones modificadas. Se estima que ma´s del 50% de las licencias de software libre son GPL. e La Free Software Foundation (http://www.fsf.org/) es una organizacio´n creada por Richard Stallman, en la de´cada de 1980, con el propo´sito de difundir el software libre. Referencia en Wikipedia: http://es.wikipedia.org/wiki/Free_Software_Foundation [consultado 14/7/2009]. f La licencia GPL es un proyecto creado por la Free Software Foundation para proteger el uso, la modificacio´n y la distribucio´n del software libre. Referencia en Wikipedia: http://es.wikipedia.org/wiki/GPL [consultado 16/7/2009].
EpiLinux EpiLinux15 es un software libre, distribuido bajo licencia GPL. Es un sistema operativo, de libre distribucio´n, especialmente orientado a la utilizacio´n de herramientas de ana´lisis epidemiolo´gico y bioestadı´stico. Pretende aportar un sistema completo y auto´nomo, de sencillo manejo y de utilidad para todas aquellas personas, tanto profesionales como estudiantes, que desarrollen sus actividades en los campos de la epidemiologı´a, la bioestadı´stica y los estudios de salud en general. Para esto, se ha recopilado en una misma distribucio´n y con un entorno homoge´neo el software necesario para realizar estudios completos de salud, bioestadı´sticos o epidemiolo´gicos. En la figura 1 se puede observar el entorno de trabajo de EpiLinux. Caracterı´sticas te´cnicas EpiLinux es una distribucio´n completa de Linux. Esta´ basado en Ubuntu, con entorno de escritorio KDE en su versio´n 3, en la que se ha incluido, entre otros programas, una recopilacio´n de software para la realizacio´n de estudios de salud: desde herramientas ofima´ticas (OpenOffice), software de Internet (por ejemplo, Firefox,) hasta software especı´fico epidemiolo´gico de ana´lisis de datos y bioestadı´stico (R, SciLab, Octave, PSPP, WinBUGS, OpenStat, EpiGrass o Quantum GIS). En cuanto al software especı´fico para la realizacio´n de estudios de salud, cabe destacar que R16 es el software de referencia de propo´sito general17. Adema´s, podremos disponer de PSPP18, un software compatible con los datos y las rutinas de SPSS. Ana´logamente, contamos con Octave como la alternativa libre de Matlab. Emulador WINE Como complemento al software nativo, EpiLinux dispone del emulador WINEg (http://www.winehq.org/), que permite ejecutar ˜ ado para Windows en su propio entorno. Funciona el software disen como un ‘‘cargador’’ para Linux de programas basados en las API Win16 y Win32. EpiLinux se puede utilizar como un sistema live y ejecutar directamente desde el DVD, lo que evita la interaccio´n con instalaciones previas de otros sistemas operativos. Tambie´n se puede instalar en el disco duro del equipo. Esta´ disponible para su descarga desde la web de la Direccio´n Xeral de Sau´de Pu´blica e Planificacio´n (http://www.galiciasaude.es/dxsp) gratuitamente, en su apartado de portada ‘‘Informacio´n destacada’’. Caso pra´ctico Utilizaremos el ejemplo expuesto anteriormente para realizar el estudio con las herramientas de software libre que nos proporciona EpiLinux. Tenemos una base de datos que necesitamos manipular; si la base esta´ en formato SPSS o tenemos rutinas escritas especı´ficamente para este paquete de software se recomienda la utilizacio´n de PSPP para la realizacio´n de las operaciones ba´sicas de ana´lisis descriptivo, regresio´n lineal y no parame´tricas. En cualquier otro caso, la eleccio´n que haremos sera´ la de R, por ser un paquete de software estadı´stico de propo´sito general que nos permitira´ importar los datos y manipularlos g WINE es un acro´nimo recursivo que significa Wine Is Not an Emulator (Wine no es un emulador). Referencia en la Wikipedia: http://es.wikipedia.org/wiki/Wine [consultado 17/7/2009].
Documento descargado de http://www.elsevier.es el 10/11/2017. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
[()TD$FIG]
T. Seoane Pillado et al / Med Clin (Barc). 2011;137(2):73–76
75
Figura 1. Escritorio de EpiLinux, donde se puede observar la barra de tareas en la parte inferior y los ı´conos de acceso directo en los laterales de la pantalla.
[()TD$FIG]
Figura 2. Ventana principal de R Commander.
directamente desde el sistema de menu´s de su entorno gra´fico (habitualmente R Commander19 o RKward20). En la figura 2 se puede ver la pantalla principal de R Commander, en la que observamos las opciones del menu´ «Estadı´sticos», como son resu´menes, tablas de contingencia, medias, proporciones, varianzas, test no parame´tricos, ana´lisis dimensional y ajustes de modelos (regresio´n lineal, modelo lineal, modelo lineal generalizado, modelo logit multinomial y modelo ordinal de regresio´n). R es un software muy versa´til que, adema´s de posibilitar su manejo desde el entorno gra´fico, nos permite la introduccio´n directa de instrucciones y la lectura de programas completos almacenados en ficheros de texto. Adema´s del potente lenguaje de programacio´n que incorpora, podemos cargar nuestras propias rutinas o packages de terceros que nos permitira´n ampliar la capacidad del programa. Existen repositorios oficiales de packages en los que se encuentran amplias colecciones de rutinas de todo tipo. El repositorio oficial se llama the Comprehensive R Archive Network (CRAN). En e´l podemos encontrar alrededor de unos 1.500 paquetes que nos permitira´n incorporar a R capacidades (valgan algunas de ejemplo) como la elaboracio´n y la manipulacio´n de
mapas, el tratamiento de bases de datos, la econometrı´a, la geno´mica, el ana´lisis filogene´ticos, la estadı´stica bayesiana, el procesado de ima´genes o el clustering. En determinados casos necesitaremos complementar nuestro estudio con la publicacio´n de mapas (incidencia, tasas ajustadas), tarea para la que esta´ especialmente indicado el programa Quantum GIS, compatible con los programas esta´ndares de sistemas de informacio´n geogra´fica (shapes de ArcGIS, tablas y mapas de MapInfo). Una vez que hemos realizado el estudio deseado, podemos continuar utilizando las herramientas de software libre que nos proporciona EpiLinux para la elaboracio´n del informe o el artı´culo correspondiente (con OpenOffice Write) y su presentacio´n en diapositivas (con OpenOffice Impress). En la figura 3 se muestran 2 de los programas integrados en la suite ofima´tica OpenOffice: Writer como procesador de textos e Impress como programa de presentaciones. Ası´ pues, la realizacio´n de estudios biome´dicos con software libre es posible (y recomendable). EpiLinux ofrece la posibilidad de disponer, en un entorno completo, homoge´neo y de libre distribucio´n, de las herramientas necesarias para la realizacio´n
Documento descargado de http://www.elsevier.es el 10/11/2017. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
[()TD$FIG]
T. Seoane Pillado et al / Med Clin (Barc). 2011;137(2):73–76
76
Figura 3. Dos de los programas integrados en la suite ofima´tica OpenOffice: Writer como procesador de textos e Impress como programa de presentaciones.
de estudios epidemiolo´gicos, bioestadı´sticos y de salud en general. Financiacio´n El proyecto EpiLinux surge de la colaboracio´n entre la Direccio´n Xeral de Sau´de Pu´blica e Planificacio´n de la Consellerı´a de Sanidade, Xunta de Galicia, y la Unidad de Bioestadı´stica de la Facultad de Medicina, Universidad de Santiago de Compostela, a trave´s de los proyectos de investigacio´n MTM2005-00818 y MTM208-01603 del Ministerio de Ciencia e Innovacio´n. Agradecimientos Los autores agradecen al profesor Eric Cobo todas sus sugerencias y consejos, que han contribuido a mejorar los contenidos y la presentacio´n de este manuscrito. Bibliografı´a 1. Abad M. GNU Project. Diversas licencias y comentarios sobre ellas [consultado 10/7/2009]. Disponible en: http://www.gnu.org/licenses/license-list.es.html 2. Microsoft Corporation. Perspectiva General de las Licencias [consultado 10/7/ 2009]. Disponible en: http://www.microsoft.com/spain/sharedsource/Articles/ LicensingOverview.mspx 3. Open source initiative. Licenses by name [consultado 10/7/2009]. Disponible en: http://www.opensource.org/licenses/alphabetical 4. Wikipedia. Licencia de software [consultado 10/7/2009]. Disponible en: http:// es.wikipedia.org/wiki/Licencia_de_software
5. Mas i Herna´ndez J. Software libre: te´cnicamente viable, econo´micamente sostenible y socialmente justo [consultado 14/7/2009]. Disponible en: http:// www.infonomia.com/img/pdf/llibrejmas.pdf 6. Bessen J. What good is free software? En: Hahn R, editor. Government Policy toward. Open source software. Washington, DC: AEI-Brookings Joint Center for Regulatory Studies; 2002. 7. Lerner J, Tirole J. The open source movement: Key research questions. Eur Econ Rev. 2001;45:819–26. 8. DiBona C, Ockman S, Stone M. Open sources: Voices from the open source revolution. Sebastopol, CA: Eds. O’Reilly & Associates; 1999. 9. Raymond ES. The magic cauldron 1999 [consultado 15/7/2009]. Disponible en: http://www.catb.org/esr/writings/magic-cauldron/. 10. Raymond ES. The cathedral and the bazaar 2000 [consultado 15/7/2009]. Disponible en: http://www.catb.org/esr/writings/cathedral-bazaar/. 11. Stallman R. Free as in freedom. 2002 [consultado 17/7/2009]. Disponible en: http://www.oreilly.com/openbook/freedom/. 12. Gonza´lez JM, Heras P, Matella´n V, Martı´nez G. Sobre software libre. Compilacio´n de ensayos sobre software libre. Madrid, 2004 [consultado 17/7/2009]. Disponible en: http://gsyc.es/grex/sobre-libre/index.html. ˜ a [consultado 17/7/2009]. Disponible 13. Libro Blanco del software libre en Espan en: http://www.libroblanco.com. 14. Stallman R. Free Software, Free Society. GNU Press, 2002 [consultado 18/7/ 2009]. Disponible en: http://biblioweb.sindominio.net/pensamiento/softlibre/ softlibre.pdf. 15. EpiLinux [consultado 18/7/2009]. Disponible en: http://www.galiciasaude.es/ dxsp. Blog [consultado 18/7/2009]. Disponible en: http://epilinux.blogspot. com. Video y presentacio´n [consultado 18/7/2009]. Disponible en: http:// www.whyfloss.com/es/conference/madrid09/program/171. 16. R [consultado 18/7/2009]. Disponible en: http://www.r-project.org/. ˜ oz M, Pe´rez S, Sa´nchez A. Estadı´stica 17. Arriaza AJ, Ferna´ndez F, Lo´pez MA, Mun ba´sica con R y R-Commander. Universidad de Ca´diz. 2008. 18. PSPP [consultado 18/7/2009]. Disponible en: http://www.gnu.org/software/ pspp/. 19. R Commander [consultado 18/7/2009]. Disponible en: http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/. 20. RKward [consultado 18/7/2009]. Disponible en: http://rkward.sourceforge.net/.