Some random notes about several topics
This project is maintained by jgbarah
Consideraciones en relación con la consulta pública sobre el “Borrador de criterios de evaluación de la Convocatoria 2023 de Sexenios de investigación”, publicado por ANECA en noviembre de 2023.
Firmante: Jesús M. González Barahona
Fecha: 16 de noviembre de 2023
Estos comentarios se centran en los aspectos relacionados con la publicación en acceso abierto, con los principios de ciencia abierta, y de forma muy especial, con el tratamiento del software en el borrador de Convocatoria. Deben consdiderarse como unos apuntes rápidos sobre el particular, pues por falta de tiempo no he podido hacer un análisis más cuidadoso.
En primer lugar, es muy adecuada la mención explícita que se hace de la publicación en acceso abierto, y de otros aspectos relacionados, y muy apropiado que se haya abierto un periodo de consulta pública al respecto. En líneas generales, creo que en caso de prosperar, este borrador puede ayudar significativamente a tener en cuenta las contribuciones científicas relevantes, y a medio plazo a mejorar la calidad y el impacto de la producción científica. Por lo tanto, la valoración global del borrador, desde estos puntos de vista es mi opinión altamente positiva. Aún así, hay algunos aspectos que considero mejorables, que detallo en el resto de este documento.
Desde el punto de vista global, y en el espíritu de lo que pretende la legislación vigente, podría ser importante mencionar, quizás en el preámbulo de la convocatoria, que a medio plazo se espera pasar a utilizar estrictamente la definición de la Declaración de Berlín sobre Acceso Abierto para decidir si un resultado de investigación está publicado en acceso abierto. Entiendo que esto sería demasiado disruptivo (y poco considerado con la actividad pasada de los investigadores, que no han recibido avisos concretos) para esta convocatoria, pero para poder llegar a conseguir los fines que se pretenden, sería conveniente ir enviando la señal de qué es realmente el acceso abierto.
“incluidas las publicaciones científicas, datos, códigos y metodologías, estén disponibles en acceso abierto”
Si la palabra “códigos” se refiere al código fuente de programas de ordenador, convendría mencionarlo de esa manera, pues la palabra “código” en español tiene un significado muy amplio, y utilizarla de esta manera puede llevar a confusión. De hecho, dado que en otros elementos (publicaciones, datos, etc.) se hace referencia al tipo de elemento, y a su formato, convendría probablemente decir “programas de ordenador” o “software” (que si, como más adelante se indica, han de distribuirse como software libre, deberían distribuirse como código fuente).
En cualquier caso, dada la especificada del software, convendría que el final, “estén disponibles en acceso abierto” fuera “estén disponibles en acceso abierto o como software libre, según corresponda”, pues el concepto “acceso abierto” aplicado al software, no se utiliza habitualmente, y puede llamar a confusión. Algo similar diría con respecto de los datos, y quizás otros elementos (por lo que podría ser mejor “estén disponibles en acceso abierto, como datos abiertos, o como software libre, según corresponda”, )
Art. 5 “el depósito en repositorios institucionales o temáticos de acceso abierto de las publicaciones científicas, conjuntos de datos, códigos y metodologías”.
Igualmente, el término “códigos” no es adecuado, sería más adecuado y más claro “programas de ordenador” o “software”. Por otro lado, el depósito de software en repositorios “de acceso abierto” plantea algunos problemas. Hay algunas opciones que pueden ser más adecuadas para el software, entre las que cabe destacar el depósito en Software Heritage [1], que además puede hacerse de forma automática, garantiza la preservación a largo plazo, y está pensado específicamente para la preservación de todo el software publicado. Además proporciona identificadores útiles para versiones específicas de un programa, que son independientes de repositorio (SWHIDs), y en gran medida equivalentes a los DOI sin necesidad de una entidad que los otorgue.
Referencias:
Art. 5 “hará pública la versión final aceptada para publicación en repositorios institucionales o temáticos de acceso abierto”
Un detalle menor: habría que indicar de qué es “la versión final aceptada para publicación”, por ejemplo indicando “la versión final aceptada para publicación de los artículos resultados de investigación”. Si no, es difícil (y quizás gramaticalmente incorrecto) saber a qué exactamente se aplica esa obligación.
Aunque no venga especificado con ese detalle en las leyes mencionadas, convendría aclarar que la “versión final aceptada para publicación” puede referirse a la versión después de la revisión (a veces llamada postprint), o al artículo publicado (que en realidad no es la versión “aceptada para publicación”), pues en algunos casos, las transferencias de derechos que firman los autores con algunas editoriales especifican que, quizás tras un periodo de embargo, puede publicarse la versión publicada en un repositorio personal o institucional, y esta versión suele incluir cambios técnicos sobre la aceptada para publicación. En otros casos es la versión aceptada la que puede ser publicada.
Además, para que el investigador no interprete mal esa frase, y por consistencia con otros textos en la propia convocaría, convendría incluir la explicación de que lo que se pide es el depósito, no necesariamente la publicación inmediata (esto es, el depósito con embargo temporal). La redacción “hará publica” difícilmente puede interpretarse como “depósito con embargo”. Podría bastar con una redacción del estilo: “depositará la versión final aceptada para publicación, o la versión publicada, en repositorios institucionales o temáticos de acceso abierto”, quizás añadiendo “Además, el artículo se hará público inmediatamente tras su depósito, salvo si un acuerdo de transferencia de derechos obliga a un periodo de embargo, en cuyo caso se hará público tras este periodo.”
Creo que sería conveniente definir en algún lugar de la convocatoria qué se entiende por un “repositorio institucional o temático de acceso abierto”. Si no, van a ocurrir situaciones como por ejemplo considerar si servicios como ResearchGate pueden ser considerado como tal, sin base real para tomar la decisión (pues archivos de ese tipo incluyen obras publicadas en acceso abierto, aunque en general no serían considerados como archivos de acceso abierto). Sugiero utilizar definiciones ampliamente extendidas, como la que utiliza la declaración de Berlín sobre Acceso abierto, y que creo que es consistente con la legislación vigente: “an online repository using suitable technical standards (such as the Open Archive definitions) that is supported and maintained by an academic institution, scholarly society, government agency, or other well-established organization that seeks to enable open access, unrestricted distribution, inter operability, and long-term archiving.”
Art. 5 “en el caso de las aplicaciones informáticas, se valorará que sean desarrolladas según los principios de colaboración abierta del software libre y publicadas bajo la Licencia Pública de la Unión Europea (https://joinup.ec.europa.eu/collection/eupl) o licencias compatibles.”
En esta frase se emplea la expresión “aplicaciones informáticas”, y no “código”. Esta podría ser una alternativa válida a “programas de ordenador”, aunque la expresión “aplicaciones” sugiere aplicaciones finales, y no, por ejemplo, bibliotecas o módulos reutilizables (por lo que “software”, o en su caso “programas de ordenador” podría ser más adecuado)
Aunque soy partidario del desarrollo colaborativo del software, en este caso no sé si es conveniente su mención. El software de interés científico no siempre se realiza en colaboración, y aún así puede ser una contribución muy valiosa. Además, este hecho no es siempre fácil de acreditar. Por último, no se valora en otros resultados de la investigación (por ejemplo, los artículos o los datos).
Creo que sería mejor hacer referencias a la definición de software libre de la FSF, la de open source de OSI [2], o las “Debian Free Software Guidelines” del contrato social de Debian [3] (las dos últimas prácticamente equivalentes), en lugar de la compatibilidad con la EUPL:
Por un lado, la compatibilidad entre licencias es un tema complejo, no siempre al alcance de un desarrollador. Baste con ver el cuadro de compatibilidad de licencias libres con la EUPL [4]
El cuadro anterior de compatibilidad con EUPL muestra también cómo licencias muy interesantes, perfectamente libres, “open source”, y compatible con los principios de acceso abierto, como la GPLv3.0. Por ello, software liberado bajo esa licencia no computaría a estos efectos, a pesar de su popularidad en el mundo del software libre.
En muchos casos, el investigador no elige la licencia de forma totalmente consciente, o sin limitaciones. Esa es una decisión que se suele tomar en los primeros momentos de un proyecto, y que luego es muy difícil de cambiar. Por ello, obligar a posteriori a que el desarrollo sea compatible con la EUPL podría ser innecesariamente lesivo para los intereses de investigadores que hayan realizado contribuciones relevantes perfectamente en línea con los principios del acceso abierto y la ciencia abierta.
LA EUPL fue diseñada específicamente para la liberación de software realizado por y para las Administraciones Públicas europeas, y no está especialmente adaptada a otros entornos (como el del software científico), por lo que es difícil de entender, en este contexto, que se le de cierta prioridad frente a otras licencias libres mucho más populares.
Los investigadores en muchos casos no desarrollan programas desde cero, sino que contribuyen a la creación con otros investigadores, de módulos software, en muchos casos de forma incremental (aunque esta contribución puede ser sostenida, muy relevante científicamente, y muy útil para otros investigadores y para el avance del estado del arte). En estos casos, el investigador no puede elegir la licencia, sino que típicamente tendrá que atender a la que haya elegido el proyecto en el que participa.
En línea con el comentario anterior. las prácticas de colaboración promovidas por los principios de ciencia abierta están muy extendidos en el mundo del software libre desde hace mucho tiempo. Por ello, convendría hablas más de “contribuciones a programas de ordenador” que “programas de ordenador”, pues lo que típicamente resulta más relevante es lo primero.
Referencias:
[4] https://joinup.ec.europa.eu/collection/eupl/matrix-eupl-compatible-open-source-licences
Art. 8 “Todas las aportaciones deberán estar publicadas o registradas, según la tipología a la que pertenezcan, en los años que se someten a evaluación”.
Modelos de aprendizaje automático (inteligencia artificial).
Apéndice.