Par données, nous entendons les ensembles de données d’occurrences, d’observations ou les checklists publiés sous la forme d’archives Darwin Core et tous les dérivés. Pour que la discussion reste concentrée, cela n’inclut pas les images ou le code logiciel.
Ce que nous espérons accomplir
- Une licence pour toute la communauté Canadensys (plus facile à regrouper et envoie un message fort en tant que communauté)
- Une licence existante (nous ne voulons pas rédiger nos propres documents juridiques)
- Une licence ouverte (permettant que nos données soient réellement utilisées)
- Une licence claire (afin que les utilisateurs puissent se concentrer sur la réalisation de recherches approfondies avec les données, au lieu de comprendre les petits caractères)
- Donner du crédit à qui le mérite
Notre recommandation
Nous recommandons aux participants de Canadensys de publier leurs données sous la licence Creative Commons Zero (CC0). Avec la licence CC0, vous renoncez à tout droit d’auteur que vous pourriez avoir sur les données (ou le jeu de données) et les consacrez au domaine public. Les utilisateurs peuvent copier, utiliser, modifier et distribuer les données sans demander votre autorisation. Vous ne pouvez pas non plus être tenu responsable de toute (mauvaise) utilisation des données.
CC0 est recommandé pour les données et les bases de données et est utilisé par des centaines d’organisations. Il est particulièrement recommandé pour les données scientifiques, et donc encouragé par Pensoft (voir leurs directives pour les articles sur les données de biodiversité) et Nature (voir cet article d’opinion). Bien que CC0 n’oblige pas légalement les utilisateurs des données à citer la source, il ne supprime pas l’obligation morale de donner une attribution comme c’est souvent le cas dans la recherche scientifique (plus d’informations à ce sujet ci-dessous).
Pourquoi devrais-je renoncer à mon droit d’auteur ?
Pour commencer, nos données, jeux de données et bases de données sont très peu protégés par des droits d’auteur. Les droits d’auteur ne s’appliquent qu’au contenu créatif et 99 % de nos données sont des faits, qui ne peuvent pas être protégés par des droits d’auteur. Nous détenons des droits d’auteur sur certains textes dans les champs de remarques, sur le format de données ou le modèle de base de données que nous avons choisi/créé, et sur les images. Si nous considérons une archive Darwin Core (qui est la manière dont nous publions nos données), le contenu créatif est encore plus réduit : le format des données est une norme et nous ne fournissons qu’un lien vers les images, pas l’image elle-même.
Il peut être difficile pour le propriétaire du contenu de déterminer où s’arrêtent les faits et où commence le contenu créatif (protégé par le droit d’auteur). Imaginez donc le cauchemar juridique que cela peut devenir pour l’utilisateur. De plus, les règles sont différentes selon les pays. La publication de nos données sous licence CC0 élimine toute ambiguïté et toute bureaucratie. Nous renonçons à tout droit d’auteur que nous aurions pu avoir sur le contenu créatif et nos données obtiennent le statut juridique de domaine public. Elles ne peuvent plus être protégées par le droit d’auteur de qui que ce soit.
Ne pouvons-nous pas utiliser une autre licence ?
Passons en revue les différentes options. Gardez à l’esprit que ces licences ne s’appliquent qu’à l’aspect créatif de l’ensemble de données, et non aux faits. Comme indiqué ci-dessus, il peut être difficile, voire impossible, pour l’utilisateur de déterminer la limite entre ceux-ci. À tel point qu’il pourrait décider de ne pas utiliser vos données du tout, surtout s’il pense qu’elles ne répondent pas aux conditions de la licence.
Tous droits réservés
L’utilisateur ne peut pas utiliser les données (ou jeu de données) sans l’autorisation du propriétaire.
Conclusion : Mauvais
Open Data Commons Public Domain Dedication and License (PDDL)
Il n’y a aucune restriction sur la façon d’utiliser les données. Cette licence est très similaire à CC0
Conclusion : Parfait, en fait cette licence était un précurseur de CC0, mais… elle est moins connue et peut-être pas aussi complète juridiquement que CC0. CC0 a fait un énorme effort pour couvrir la législation de presque tous les pays et la communauté Creative Commons travaille dur pour améliorer encore cela. Par conséquent, si vous devez choisir, CC0 est probablement le meilleur choix.
Creative Commons Attribution-NoDerivs (CC BY-ND)
L’utilisateur ne peut pas construire de proejets de recherche en s’appuyant sur les données (ou jeu de données), ce qui est le cas de la plupart des utilisations de données.
Conclusion : Mauvais
Creative Commons Attribution-NonCommercial (CC BY-NC)
L’utilisateur ne peut pas utiliser les données (ou le jeu de données) à des fins commerciales. Cela semble acceptable d’un point de vue académique, mais la licence est beaucoup plus restrictive qu’on ne le pense intuitivement. Voir : Hagedorn, G. et al. ZooKeys 150 (2011). Creative Commons licenses and the non-commercial condition: Implications for the re-use of biodiversity information.
Conclusion : Mauvais
Creative Commons Attribution-ShareAlike (CC BY-SA) ou Open Data Commons Open Database License (ODbL)
L’utilisateur doit partager tout travail basé sur les données (ou ensemble de données) sous la même licence ou une licence similaire à celle-ci.
Conclusion : Bien, mais… cela peut poser quelques problèmes pour un agrégateur comme Canadensys ou GBIF : s’ils mélangent et fusionnent des données avec différentes licences « SA », laquelle choisissent-ils ? Elles peuvent être incompatibles.
Creative Commons Attribution (CC BY) ou Open Data Commons Attribution License (ODC-By)
L’utilisateur doit attribuer les données (ou jeu de données) de la manière spécifiée par le propriétaire. Cette condition est également présente dans les trois licences ci-dessus.
Conclusion : Bien, mais… cela peut conduire à un « empilement d’attributions » peu pratique. Si un agrégateur ou un utilisateur de cet agrégateur utilise et intègre différents ensembles de données fournis sous une licence BY, il doit légalement citer le propriétaire de chacun d’entre eux de la manière spécifiée par ces propriétaires (là encore, pour le contenu créatif potentiel des données).
Mais donner du crédit/attribution est une bonne chose !
Absolument, mais l’imposer légalement peut avoir l’effet inverse : un utilisateur peut décider de ne pas utiliser les données par crainte de ne pas se conformer complètement à la licence (voir le paragraphe ci-dessus). Comme indiqué au début de cet article, CC0 supprime l’obligation juridiquement contraignante de citer l’auteur, mais elle ne supprime pas l’obligation morale de citer celui-ci. En fait, c’est la pratique courante dans la recherche scientifique depuis de nombreuses décennies : légalement, vous n’êtes pas obligé de citer les recherches/données de quelqu’un que vous utilisez, mais ne pas le faire ne vous rendra pas non plus très populaire.
Pour encourager les utilisateurs à créditer les auteurs, nous proposons de créer des normes Canadensys. Les normes ne sont pas un document juridique, mais un « code de conduite » dans lequel nous indiquons comment nous souhaitons que les utilisateurs utilisent, partagent et citent nos données, et comment ils peuvent participer. Nous pouvons expliquer comment citer un spécimen individuel, une collection, un ensemble de données ou un téléchargement « Canadensys » agrégé. Nous pouvons souligner que nos données sont constamment corrigées ou complétées, il est donc utile de revenir sans cesse au référentiel d’origine et non à un référentiel secondaire qui n’a peut-être pas été mis à jour. En plus de cela, nous pouvons créer des outils pour surveiller les téléchargements ou compiler automatiquement une citation adéquate. Et avec l’arrivée des articles de données - dont les brouillons peuvent être générés automatiquement à partir de l’IPT - les jeux de données sont réellement introduits dans le domaine de l’édition traditionnelle et de la reconnaissance scientifique associée.
Tout cela pour dire que ce sont des mécanismes dont bénéficient à la fois les utilisateurs et les propriétaires de données, sans les contraintes juridiques. Cela garantit que nos données peuvent être utilisées maintenant et à l’avenir. Nous espérons que vous vous joindrez à nous dans notre recommandation.
Un grand merci à Gregor Hagedorn et aux auteurs des lignes directrices de Pensoft pour les documents sur les données.