C'est trop drôle... ce logo n'a jamais été déposé par Disney...



.

by Popo le Chien (noreply@blogger.com) at July 05, 2008 02:23 AM
by Popo le Chien (noreply@blogger.com) at July 05, 2008 12:55 AM
by Popo le Chien (noreply@blogger.com) at July 05, 2008 12:54 AM
<!– @page { size: 21cm 29.7cm; margin: 2cm } P { margin-bottom: 0.21cm } –>
En créant ce blog c’est un des sujets que je voulais aborder, mais un nouveau travail et différents choses à faire ne m’ont pas laissé le temps d’écrire ce post. Ou alors tout simplement la fainéantise, probablement déjà plus juste. On ne se refait pas.
Parlons donc du traitement de l’actualité sur Wikipédia et non pas de l’actualité de Wikipédia ou de Wikipédia dans l’actualité …
Notre communauté, notamment du fait de son nombre, draine des personnes ayant des avis très variés sur beaucoup de domaines en particulier sur celui-ci. Ces divergences de vues sont parfois le point de départ de discussions enflammées voir même de querelles profondes. De mon coté, je ne vis pas dans une bulle, je m’informe par différents médias : internet, presse écrite, journal radio. Je suis sensible au traitement des différents sujets d’actualités.
Compte tenu de la place qu’occupe aujourd’hui Wikipédia sur le Web, il est illusoire de penser que les internautes n’utilisent pas Wikipédia comme un site d’information en temps réel. Cependant Wikipédia est une encyclopédie qui n’a pas la même finalité ni les mêmes moyens que l’AFP ou divers sites spécialisés. Alors que faire ? Je pense qu’il faut répondre aux besoins, aux attentes des lecteurs. On n’écrit pas Wikipédia soi même, on l’écrit pour qu’elle soit lue. Ne pas le faire serait un peu se moquer des lecteurs potentiels de l’encyclopédie .
Ensuite, se pose le problème de comment traiter cela. Dans les heures qui ont suivies la libération d’Ingrid Betancourt l’article a été le centre d’intérêt de très nombreux contributeurs. Il y a vraiment eu de tout et n’importe quoi. L’article a fait l’objet d’environ 150 modifications en moins de cinq. En fouillant un peu dans les pages de discussions à droite et à gauche, on peut notamment lire que pour un contributeur l’article est un “bloque-note” dans lequel il met tout ce qu’il voit à la télé, on fera le tri après.
Je n’ai pas du tout cette vision de la chose pour moi il faut rester ultra-factuel, se borner aux éléments fondamentaux. En temps réel Wikipédia ne peut pas avoir de sources solides pour travailler, un laps de temps de quelques heures sur le traitement de l’information est nécessaire. Dans ce genre de cas, il permet d’obtenir un petit peu de recul suffisant non pas pour faire un joli travail mais suffisant pour ne pas tomber dans le traitement au premier degré frôlant le travail inédit.
Voilà un peu mon idée sur la chose, c’est un peu brouillon mais j’ai posé un premier jet qui pourra donc évoluer au fil de vos éventuels commentaires, et aussi du vécu in-situ sur WP.
Ludo
Dans un article d'introduction au calcul quantique publié dans Pour la science d'avril 2008, l'auteur disait qu'un calcul faisable en temps polynômial était « faisable ». Je n'aime pas trop ce raccourci, surtout dans un article très « grand public ».
Expliquons simplement de quoi il s'agit. On mesure souvent le coût d'un calcul (au sens large, il peut s'agir par exemple de trier des données) en fonction de la taille du problème. Un algorithme linéaire est une méthode de calcul dont le coût de calcul (généralement, le temps de calcul) double quand la taille du problème double, un algorithme quadratique dont le coût quadruple quand la taille du problème double, et un algorithme exponentiel voit son coût doubler quand la taille du problème augmente d'une certaine quantité fixée (par exemple, double quand on augmente la taille de l'entrée de 1).
Autrement dit, un algorithme exponentiel devient vite trop coûteux. Mais un algorithme quadratique peut aussi être trop coûteux, suivant le type de problème...
Voici mon commentaire au courrier des lecteurs :
avec k = 2 ou 3 peut déjà être « déraisonnable » : essayez de trier une base de données de plusieurs millions d’entrées avec un algorithme en n² ! La notion de ce qui est « raisonnable » ou non peut varier d’un domaine à l’autre.Dans Les limites du calcul quantique (voir Pour la Science n° 367, mai 2008), Scott Aaronson déclare : « Les problèmes résolubles en un temps raisonnable même pour n grand sont ceux pour lesquels il existe un algorithme dont le temps de calcul augmente de façon polynomiale, c’est-à -dire comme une puissance fixée de n. » Il s’agit d’un raccourci de langage classique dans les présentations « intuitives » ou « grand public » de la théorie de la complexité et notamment des notions de classe NP et de NP-complétude. Mais ce raccourci est un peu dangereux, car il ne correspond pas au sens usuel du terme « raisonnable ». En effet, un algorithme de complexité nk
Surtout que ce qui est raisonnable ou pas varie selon le contexte : il me semble avoir entendu Moshe Vardi dire que pour les besoins d'un exposé, il considèrerait comme raisonnable un algorithme en temps simplement exponentiel...
Réponse de Jean-Paul Delahaye
Et dire que j'ai passé le mois de juin à râler sur des élèves qui ont transformé de paisibles parcours en temps linéaire en algorithmes quadratiques... Voir aussi ce remarquable énoncé où l'on calcule la suite de Fibonacci avec un nombre d'opérations arithmétiques exponentiel, linéaire, puis logarithmique en l'indice du terme dans la suite... Ami lecteur, il y a d'ailleurs un piège sémantique dans ma dernière phrase, sauras-tu le trouver ?
Je serais intéressé de recueillir des réactions de chercheurs, d'universitaires et d'enseignants à l'égard de Wikipédia.
J'ai entendu des réactions plutôt positives de la part de collègues de l'X et de Grenoble, des réserves de la part d'enseignants du secondaire en histoire, mais j'aimerais un plus large éventail de réactions.
Vous pouvez réagir par mail privé (David POINT Monniaux AT Wikimedia POINT fr) ou ici. Merci de préciser votre nom, votre discipline et votre établissement de rattachement, et de justifier un peu votre réaction. En effet, visiblement, les problèmes ne sont pas les mêmes suivant les disciplines, dans certaines il y a plus de problèmes de plagiat Internet que dans d'autres, etc.
J'ai reçu mon premier courrier en OOXML !
De nombreux secrétariats envoient par courriel des textes sous forme de fichiers Word, même quand il s'agit de texte brut, voire d'une copie d'une page Web ou d'un courriel HTML. Il est assez vain de vouloir faire changer quoi que ce soit, tellement le réflexe « texte = Word » est devenu naturel. (Je ne blâme d'ailleurs pas les personnels de secrétariat, dont on ne peut exiger qu'ils aient des réactions d'informaticiens.)
Problème : depuis Office 2007, le format de sauvegarde par défaut est le .docx, incompatible avec le format antérieur. Ni les versions précedentes d'Office, ni OpenOffice.org ne le lisent, du moins sans ajout de convertisseurs et modules additionnels.
J'ai reçu comme cela un courrier contenant des données administratives importantes...
N'ayant pas de PC Windows sous la main (du moins sans redémarrage assez ennuyeux), j'ai étudié le fichier OOXML. Le format ressemble beaucoup au format Open Document : une archive Zip contenant des fichiers XML. Un petit coup de XSLT et j'ai récupéré le texte.
Commentaire : ce genre de mésaventures explique sans doute largement le succès de Microsoft Office dans les entreprises. Entre perdre du temps (et le temps, c'est de l'argent) à utiliser des convertisseurs plus ou moins foireux ou à tenter de convaincre des gens d'utiliser leur ordinateur autrement (par exemple, en en copiant-collant pas des documents texte ou HTML dans Word pour les sauver), d'une part, et simplement payer une mise à jour, d'autre part, le choix est vite fait.
(Ceci dit, le plus amusant est encore le courriel au format Word qui invite à aller retirer un document dans un service, lequel document est distribué à toute personne qui se présente par impression d'un document Word. On se demande bien pourquoi ne pas avoir mis le document directement dans l'email... Ou tout simplement sur l'Intranet ? Ah mais, typiquement, seules quelques personnes ont le droit d'écrire sur Intranet ! Dès fois qu'il y ait des abus, vous comprenez !)
PS: Au passage, admirons la confusion savamment entretenue au sujet des formats « OpenDocument », « Open Office XML » etc.
Il est déjà bien difficile de vérifier et tester des programmes en flottants, si en plus on rajoute des incompatibilités inattendues...
Vous pensez qu'un programme utilisant float et double fonctionne à l'identique sur toutes les plates-formes « compatibles IEEE-754 ». Grossière erreur, et je vous recommande par exemple la lecture de cet article, ce post ou encore celui là .
Un des pièges du domaine est l'existence au sein de l'architecture IA32 (Pentium) de deux systèmes de calcul en virgule flottante, subtilement différents.
Je croyais le PowerPC plus sain. Hé bien non... Je viens d'apprendre que les PowerPC e500, modèle destiné aux systèmes embarqués, on un système de calcul en virgule flottante incompatible avec celle des PowerPC destinés aux machines de bureau, et également incompatible avec IEEE-754 (pas de dénormaux, pas d'infinités, par exemple).
Il est courant que les processeurs de traitement de signaux implémentent des flottants quasi IEEE-754, moins quelques particularités coûteuses à gérer et de peu d'importance dans les applications courantes.
Reste que toutes ces incompatibilités et bizarreries compliquent considérablement les tâches d'analyse, validation, vérification, notamment quand on travaille sur des systèmes embarqués critiques.
Je pousse (encore une fois) un grand soupir.
(Et pour tout arranger, la documentation PowerPC est un modèle de bureaucratisme informatique : documents de plusieurs centaines de pages, multiples, se référant les uns aux autres, sigles nombreux, terminologie maison, etc.)
1) Ce serait l'absence de résultats satisfaisants pour WALL-E qui n'aurait pas fait grimper l'action Disney qui préoccupe certains journalistes économiques... c'est quand même tiré par les cheveux pour des journalistes digne de ce nom... et on s'en fout complètement.
Le parc de Tokyo ouvre un nouvel hôtel ... les journaliste insistant sur le truc superfétatoire par exemple une boutique pour les fillettes qui pour 250$ peuvent se transformer en princesse (vêtements, bijoux, coiffeur, ... et photographe). Heureusement qu'ils parlent aussi du futur Cirque du Soleil devant ouvrir à l'automne... Sinon l'hôtel semble vraiment sympa... Un peu plus coloré que les autres hôtels victoriens de Disney (blanc en Floride, presque blanc cassé à Hong Kong, rose-saumon en France)
Je vous avais promis il y a plus d’une semaine un billet sur mes anticipations japanim-esques de la prochaine saison, mais ça sera pour plus tard : la “vie réelle ” m’a rattrapé et cette vilaine me mange pas mal de temps actuellement, au détriment de celui que je passe sur le net.
Ça ne veux pas forcément dire que je croule sous le boulot, juste qu’il y a pas mal de choses que j’ai envie de faire ces temps ci. Après tout, c’est l’été, l’occasion ou jamais de profiter du soleil (enfin, en dehors des horaires de boulot)…et actuellement, de la fraicheur des salles climatisées, fête du cinéma oblige :)
Je comptais lancer cette fameuse procédure pour la création de 2 nouveaux namespaces, traduire quelques articles (1, 2, etc.), faire un peu de propagande pour mes idées wikipédiennes sur le présent blog ou y parler un peu plus manga et robotique, et quelques autres trucs… mais ça attendra. Après tout, une mini cure de désintox de temps à autre, ça ne peut pas faire de mal.
NB : allez voir le 2eme opus du Monde de Narnia, ça vaut le coup d’oei.

by Popo le Chien (noreply@blogger.com) at July 02, 2008 11:13 AM
by Popo le Chien (noreply@blogger.com) at July 01, 2008 04:03 PM
by Popo le Chien (noreply@blogger.com) at July 01, 2008 01:15 PM



by Popo le Chien (noreply@blogger.com) at June 30, 2008 12:26 PM