mardi 27 décembre 2011

Wikimedia Commons interdite aux Mongols

Il est gros, il est mongol: c'est un gros Mongol.
J'espère qu'il n'y a pas de dicton qui énonce qu'une amitié ne se réalise qu'avec de la vodka à dix heures du matin, parce que ça voudrait dire que je n'ai qu'un ami, et que c'est le monsieur présenté à droite. Il s'appelle Natsca, il est mongol et très sympa, d'ailleurs on a bu de la vodka ensemble à dix heures du matin, c'est dire.

Le problème de Natsca (et surtout le mien), c'est qu'il ne parle que mongol, avec un tout petit peu de russe: c'est dommage, parce que s'il savait sûrement plein de choses, il ne pouvait pas trop les partager. Ces choses qu'il savait, et qui à l'époque m'intéressaient énormément, concernaient bien sûr la faune locale, à commencer par les chevaux. 

Fun fact: il existe en mongol six mots pour distinguer un poulain, suivant qu'il ait un, deux, trois, quatre, cinq ou six ans. A sept ans, c'est un cheval (et donc un septième mot).

Imaginons, et c'est bien sûr un exercice de pensée, que Natsca décide de contribuer à Wikipédia. Voire à la banque d'images Wikimedia Commons, avec son savoir équestre et chevalin. C'est une proposition à moitié farfelue seulement quand je vois le temps et l'effort (et donc l'argent) dépensés par la Fondation pour adapter le logiciel MediaWiki à des langages dont j'ignorais l'existence il y a encore un mois.

Le problème toutefois, quand on contribue à Commons, c'est qu'il faut parler anglais, parce que les catégories sont en anglais, avec des translittérations toujours un peu hasardeuses (forcément) si c'est de l'étranger pas latin. Je sens que je perds ici un peu l'attention de mon lectorat, donc on va prendre un exemple concret:

Hop.
Vous pensez ne voir qu'un bête cheval marron/noir (il y a un mot en français pour ça d'ailleurs), alors qu'en fait ce n'est pas un cheval mais un -accrochez-vous- coëoлoн: un canasson de cinq ans. Allez donc me catégoriser ça, tiens. Et tant que vous y êtes, demandez-vous s'il ne serait pas pertinent de remplacer la catégorie Nil bleu par Nil vert ou noir, vu qu'une floppée de langues n'ont pas cette nuance1.

On aura bien compris que les langues étrangères c'est compliqué, et que parfois les étrangers savent des trucs que nous on ne sait pas2. L'étranger qui veut contribuer, puisque la mode c'est de chercher les contributeurs hors du monde occidental, est du coup confronté doublement à la barrière de la langue: non seulement il ne parle peut-être pas celle qu'il faut, mais en plus celle-ci ne décrit pas le monde de manière correcte.

Les catégories, c'est vraiment pourri.

Hors, puisqu'on en est à mettre de l'argent pour bricoler MediaWiki pour les non-romanisés, je me demande combien ça couterait de mettre en place (i) un système d'étiquettes (tags) plutôt que de catégories; et (ii) conjoitement mais au pire tout seul, de faire en sorte qu'on puisse catégoriser dans la langue de son choix. Le système reconnaît déjà ma langue de prédilection quand je me connecte (la plupart des cadres sont en français), il ne devrait donc pas être trop dur de me donner par défaut les catégories dans ma langue, et si elles sont absentes celles de la lingua franca de service. A charge pour moi de traduire au plus près.

C'est une question légitime, non?


1. Ce qui est fou quand on y pense. Ca me rappelle quand j'étais à l'école et essayais de me représenter la valeur de i, nombre "imaginaire". Idem pour les sinus et cosinus: autant vous dire que je n'ai jamais vraiment brillé en maths.
2. Par contre je me suis laissé dire que les eskimos n'avaient pas 50 mots pour la neige comme on le prétend souvent.

4 commentaires:

Léna a dit…

http://commons.wikimedia.org/wiki/User:Multichill/Next_generation_categories

Ludo a dit…

Par contre en breton on a 20 mots pour le soleil.

Le concombre masqué a dit…

"Le problème toutefois, quand on contribue à Commons, c'est qu'il faut parler anglais, parce que les catégories sont en anglais"

Ben yaka poster son image ou autre fichier sonore sans lui mettre une catégorie ! Contribuer sur Commons est permis aussi aux contributeurs assez inconscients pour ne pas percevoir l'utilité de ce gadget.

Anonyme a dit…

Catégoriser c'est bien, mais il faudrait pouvoir au moins les traduire. La catégorisation n'est pas un gadget mais cela permet de ranger pour trouver plus facilement. Les tags c'est bien mais ça peut être très imprécis, et des catégories trop précises fait de Commons une usine à gaz où on passe son temps à trier... Bref il faut que ça change et même si on croit qu'une simple traduction des catégories Commons suffirait... Ton article nous prouve le contraire. Pourquoi catégoriser ? Pour améliorer la recherche de Commons. Ceci dit quand on cherche un corbeau on devrait avoir le même degré de pertinence entre la recherche en anglais et la même dans une autre langue ce qui est hélas loin d'être le cas.