Tuesday, June 30, 2009

De la (faible) visibilité des images remarquables des projets Wikipédia, un constat d'echec...

Je sais le titre est long et peu clair, je m'explique:

De quoi je parle?

D'images présentes sur les projets Wikimédia.
"Primées" pour des qualités données, selon des critères données,
un peu comme on a des Articles de Qualité et des Bons Articles sur Wikipédia.

Sauf que la ça se complique un peu,
on a en effet:
  • des Featured Pictures (Images Remarquables - aussi noté COM:FP), pour des images d'une qualité exceptionnelle aussi bien sur le plan technique que sur le plan du sujet, on parle souvent d'effet 'WoW!' comme critère à propos de ces images.
  • des Quality Images (Images de Qualité - aussi noté COM:QI), pour des images dont la qualité technique est avérée et certaine.
  • des Valued Images (Images de Valeur - aussi noté COM:VI), pour des images qui ont une utilité assurée, notamment dans le cadre de Wikipédia.
Ça ne s'arrête pas la: en effet, certains Wikipédia (dont la version anglaise) ont aussi des:
Et évidemment, les critères sont sensiblement différents par rapport à ceux de Commons même si les buts semblent être les mêmes.

Maintenant, revenons à nos moutons:

Quel est l'intérêt de primer une image en tant qu'image remarquable, de qualité ou d'un autre label?

On va me dire 'ben l'image est labelisée, elle est donc plus visible que les autres'.

Le hic, c'est qu'il y a: (à ce jour, le 01/07/2009)
FP/Commons: 2019 images. (tirés du nombre d'images de la catégorie associée.)
QI/Commons: environ 5600 images. (obtenu par l'utilisation du modèle associé, on peut noter l'absence de catégorie mère qui permettrait des les retrouver plus facilement d'un coup.)
VI/Commons: 739 images. (somme du nombre d'images des catégories correspondant aux mois de nomination.)

FP/en wikipédia: 1825 d'après la page en question.

QP/en wikipédia: 78 d'après la page en question, ce chiffre s'explique probablement par le fait que c'est une procédure nouvelle sur la version anglaise de Wikipédia et donc avec peu d'images nominées.

Encore un autre hic, c'est qu'une image peut être primée sur une des Wikipédia et pas sur Commons, et vice versa. Les personnes donnant leur avis sur les dites images ne sont bien sur pas les mêmes, et on au dires de certains pas forcément les même habitudes si on doit comparer les wikis. Il n'y a donc d'équivalence que dans le nom et dans une qualité globale supposée.

Il y a aussi des points à noter, tel qu'une forte présence de macro d'insecte, technique bien éprouvée, qui ne nécessite somme toute que le matériel adéquat, un insecte et de la patience, ce qui est quand même plus facile que de devoir attendre par exemple, un coucher de soleil avec tel ou tel nuage dans un endroit parfois pas forcément très proche... On va me dire que je chipote mais bon c'est juste pour le troll^W Sport...

L'image est en général primée si plusieurs contributeurs supportent la promotion de celle-ci et que d'autres ne s'y opposent pas. En cas de problème, notamment avec des contestations possibles, une discussion plus poussée peut être engagée, afin de résoudre les différents.

On peut aussi noter un gaspillage de ressource, de temps et de moyen, une image primée sur commons pouvant être labélisée au même titre sur en... Je sais, certaines personnes n'aiment pas Commons, d'autres disent que ce doit être un service pour les autres projets, ce serait bien, quitte à faire quelque chose de rigolo et d'inutile (mon point de vue bien sur, voir plus loin pourquoi), de ne le faire qu'une fois...

Et tout ca pour quoi?

Il y a un effet que je ne peux nier, c'est l'effet 'Image du Jour/Image de l'année'

L'image du jour, que ce soit de Commons ou de Wikipédia anglaise est généralement choisie dans les images promues, donc il y a pour un jour donné une forte visibilité sur une image.

Je vrais prendre trois exemples, deux images du jour et l'image lauréate de l'année 2008:
  • L'image du 26 juin 2009, représente la lune, les stats associées, montre un pic de 12500 hits le jour en question, pour des consultations épisodiques (40 par jour grand maximum...) qui peuvent s'expliquer par le positionnement de l'image sur l'article de Wikipédia anglaise.
  • L'image du jour du 29 juin 2009, c'est un panorama de New York City... les stats donnent une moyenne de 600 à 700 hits par jours et l'on peut voir un pic de 53000 hits pour le jour en question.
    Le fort taux de consultation hors Image du jour est due à la présence de cette image au milieu de l'article anglais de New York City.
L'image de l'année 2008 de Commons, résultat de long mois de débat, de vote, de discorde (si si si hélas...) parmi les images ayant été primées en 2008 (je simplifie un peu la, ce n'est pas mon propos ici...), les stats de juin 2009 (sur Commons) montrent un pic de 7500 hits le 3 juin, jour de l'annonce probable sur Commons. On remarquera que la POTY de Commons est moins consultée qu'une image du jour de la Wikipédia anglaise...

Ce que je conclue des trois exemples est assez simple: le fait que l'image soit 'Featured' ne change pas grand chose à sa fréquentation hormis les quelques jours de gloire qu'elle peut avoir, elle ne doit sa fréquentation usuelle qu'à cause de son positionnement dans un article. Plus l'article est fréquenté plus l'image sera visible.

Il y a bien sur des visibilité liées à une actualité spécifique, quand l'image se retrouve en page d'accueil d'un Wikipédia, mais elles sont par nature très limitées, on peut se poser la question de savoir quand cela devient de l'auto congratulation d'ailleurs...

D'une manière similaire, quand on veut illustrer un sujet (par exemple mettre une image sur un article de Wikipédia) et utiliser Commons comme base de départ, on retrouve le même aspect du problème, que l'on utilise un moteur de recherche (interne ou non) ou la catégorisation de Commons quand cela est possible et suffisant (oui, parfois l'image est mal ou pas catégorisée...), on aura la même constatation: Le nombre d'images de Commons dépasse les 4 millions, donc les images primées sont minoritaires et noyées dans la masse, il y aura de très faibles chances qu'une image primée soit disponible pour un sujet quelconque, le fait de primer une image n'aide donc absolument pas à la visibilité d'une image. En revanche, le fait d'utiliser une image peut la faire primer mais bon j'aurai tendance à voir ça comme un effet parasite, le but d'utiliser une image sur Wikipédia ne devrait pas être de la faire primer...

Pour conclure...

Tout cela me donne l'impression que ces procédures de 'pseudo-certification' sont ici des usines à gaz, à discordes pour au final un résultat très symbolique, on peut bien sur s'en servir pour trouver de magnifiques Wall Papers, pour gonfler l'ego des photographes ou faire des communications aux journalistes en disant 'on a des images exceptionnelles...' au final les images en question ne seront pas plus vus que les autres, si l'on excepte les épiphénomènes précédemment cités... Je me demande si on ne s'est pas éloigné un peu du but qui était recherché et si on est pas en train de perdre notre temps depuis le début...

4 comments:

  1. C'est Valued pictures, pas valuated.

    Personnellement ce système m'a été utile en quelques (rares, ok) occasions : besoin d'une image sur un thème (par exemple Tokyo la nuit il me semble), catégorie correspondante blindée. Hop, petite intersection avec CatScan entre cette catégorie et celle des FP/VP/QP. C'est une façon comme une autre de filtrer.

    Sinon, je comprends pas non plus pourquoi en: a ses FP/VP. Faudrait se renseigner sur le pourquoi de la création de ce système. Au hasard : les anglophones encore plus que les autres s'en tapent de Commons ? (de toute façon à quoi ça sert, hein, ils peuvent uploader chez eux, et sous encore plus de licences, alors à quoi bon [j'exagère à peine]).

    ReplyDelete
  2. J'ai corrigé le 'Valuated', merci pour la correction.

    Sur le pourquoi des images remarquables de en, je ne connais pas l'explication, probablement des dissensions entre en et commons...

    Les images doivent être libres ou domaine publique sur en pour être 'primable', donc l'explication des licences plus étendues, je pense au 'fair use', ne tient pas, d'autant plus qu'il suppose une résolution timbre poste... donc un peu incompatible avec le contexte de qualité...

    Ensuite je suis peu certain que le commun des mortels utilise CatScan, quand aux réutilisateurs externes je ne sais pas.

    Un autre problème est qu'article de qualité est généralement le résultat d'une évolution avec le temps, alors qu'une mauvaise photo ne pourra jamais évoluer en bonne photo...

    ReplyDelete
  3. C'est vrai, CatScan c'est un peu un truc de « Power-users » comme on dit :-) (quoiqu'il y a un lien "Balayer" sur toutes les catégories maintenant il me semble)

    Ce que je voulais dire par mon ronchonnement sur en : je me rappelle une fois je passais par hasard sur la PDD du projet jeu vidéo anglophone. Là un user, du genre gros pilier présent depuis 3 ans avec n BA et AdQ à son actif, demande s'il a le droit de recadrer une photo de Commons d'un groupe de développeurs sur un gars en particulier. On lui répond qu'il y a pas de souci... et il l'importe sur en.wiki. Du coup je lui dis sur Commons, que tous les autres wikis en profitent, tout ça. Il ne savait pas qu'il avait un compte Commons, alors qu'il avait activé le SUL.
    Bon ok, l'exemple est un peu biaisé vu que sur le projet jeu vidéo ils uploadent surtout des fichiers en fair-use. Mais ça ne me surprend pas vraiment de voir un système parallèle de labélisation d'image sur en (qui, je suis entièrement d'accord avec toi, est complètement redondant).

    ReplyDelete
  4. Oui le lien balayer est bien présent, maintenant bon, pour l'usage en question, je pense que c'est quand même tordu:

    Va faire un catscan sur une VI ou une QI et tu vas pleurer, vu qu'elles n'ont pas de catégorie globale. J'ignore si catscan peut gérer les templates ou pas (c'est down pour moi pour l'instant, donc je ne peux pas vérifier...)

    Sans parler qu'un catscan va manquer toutes les images mal catégorisées ou non labellisées alors que potentiellement elles sont aussi bonnes que les autres...

    Mais je pense que le problème est que le système n'est pas adapté: le besoin se justifie effectivement quand les catégories sont remplies à raz-bord... mais bon quand les catégories sont maigres, autant regarder toutes les images... Si on voit une bonne image, on l'utilise, si on a du temps à perdre et pas peur de s'en prendre plein la tronche on propose sa labelisation...

    Il vaudrait mieux pouvoir filtrer des catégories selon des métriques tels qu'une note potentielle (avec tous les problèmes que ca peut présenter), la résolution utilisée, la taille de l'image et l'indice de compression jpeg... Qu'on puisse au moins éliminer toutes les images timbre poste ou non imprimables d'un coup...

    Techniquement parlant, un autre problème des labels est que rien ne garantie que l'image sera correcte une fois imprimée sur un poster de 70x56... Les proposants ont tendance à faire du downsampling (réduire artificiellement la résolution), pour éviter de se faire recaler les images pour des images 'floues' dans certaines zones... L'image a l'air effectivement très bien sur un écran, mais à l'impression on peut avoir des surprises...

    Enfin bon je pense que je parlerai de ca dans un autre post...

    ReplyDelete