La recherche française va de plus en plus mal...
... et mon lycée porte désormais, comme tant d'autres, le nom d'un homme de sciences décédé.
... et mon lycée porte désormais, comme tant d'autres, le nom d'un homme de sciences décédé.
Il est impossible de s'enflammer ici.
Et le lycée Alexandra David Neel il existe toujours ? J'y ai fait ma première colo en 19... et des poussières.
@ Jean-Michel : Pour autant que je sache, oui. Mais le PGdG (anciennement Lycée Techno des AHP), il a vachement plus la classe. Enfin, surtout de mon temps (grâce au proviseur de l'époque, pas à moi, hein).
Et les frères Bogdanov sont toujours vivants...
Le titre, c'était purement gratuit, ou bien ?
Alexandre : je pencherais plutôt pour un bug de dotclear qui affiche ici le titre d'un billet avec un an ou deux d'avance.
''(cherchez IPot sur Exalead pour plus de détails)
(cherchez Exalead sur Google pour plus de détails)''
@ You : Tu sais bien mon petit que ce sont toujours les meilleurs qui partent les premiers.
@ Alexandre : Fugues et variations sur le thème : la recherche française ne se porte déjà pas fort bien, si en plus les prix Nobel se mettent à décéder...
@ Mon Ange : A quand la VoIPot ? Plus sérieusement, à part de (1) ne pas être Google et (2) afficher des aperçus qui, dans mon cas, fatiguent la rétine, c'est quoi l'intérêt d'Exalead ?
Ah, et les balises wiki doivent être fermées avant de passer à la ligne et rouvertes à la ligne suivante si nécessaire.
Par exemple :
''Ceci
n'est pas en italique''
Mais ceci l'est
Oui, je me suis dit que c'était sûrement le cas, mais j'ai été joueur et j'ai posté sans prévisualiser.
Sinon, pour Exalead, c'est juste que j'en ai marre de dire « Google est ton ami ». Et les termes de recherche associés, et les choix de langue, etc. (mais ce n'est pas toujours pertinent).
http://linuxfr.org/... d'ailleurs (par hasard)
@ Mon Ange : J'ai suivi les conseils d'un des commentaires du lien proposé et tapé mon nom dans Exalead. Ma page « pro » n'est pas apparue alors qu'elle est le premier résultat sur Google (en anglais tout du moins).
Je crois que je vais rester intoxiquée à Google...
Oui, les résultats sont clairement en retrait, notamment sur les pages anglaises. Par contre, si l'on se restreint au web français, il se défend très bien. Il est à mon avis particulièrement intéressant pour les francophones non-anglophones.
@ Mon Ange : Je pensais pourtant que l'indexation de texte ne dépendait que difficilement de la langue...
Effectivement, il a une certaine classe le PGDG, même si notre objectivité reste à prouver ! Et merci pour le lien, souvenirs souvenirs...on y revoit des têtes connues, on se rappelle même qu'on a suivi un jour des cours de SVT...
On va s'écarter encore un peu plus mais précisons ce point : si l'indexation proprement dite ne dépend pas de la langue (encore que, la gestion des accents n'est pas toujours triviale), obtenir des résultats de recherche pertinent nécessite des connaissances extra-textuelles, entre autres linguistiques. En vrac, je pense à la recherche de sonorités proches, à la mise sous forme normale des mots (verbes à l'infinitif; adjectifs et noms au singulier, etc.), l'élimination des mots non significatifs (mais, ou, et, donc, etc.), la correction orthographique. Je suis sûr qu'on pourrait détailler encore plus en rentrant dans des techniques poussées, notamment en ce qui concerne la recherche de catégories (comme celles suggérées sur le côté par exalead).
Tout ceci peut se faire de manière automatisée par des algorithmes génériques (d'ailleurs, la correction orthographique, du moins chez Google, n'est pas fondée sur un dictionnaire mais sur des statistiques d'occurrence) ; mais parfois, c'est plus efficaces si tu optimises pour telle ou telle langue. Cf. le blog de Jean Veronis, mais j'ai plus le billet en question sous la main.
@ Pimousse : Classe, en toute objectivité. Point !
@ Mon Ange : Pour tout dire, la recherche rapide textuelle est une de préoccupations de mon labo.
Je pense cependant qu'aucune amélioration contextuelle ne devrait concerner les mots non-normalisables et non-non-significatifs qui apparaissent dans le titre des pages web, et qui ont toutes les chances d'être le nom d'une personne ou d'une compagnie. (Et on peut alors discuter de la normalisation et de la signification).
Ce n'est juste pas normal, à mon sens, qu'un moteur de recherche trouve des pages où mon nom (qui comme tu le sais n'a rien de commun) apparaît et ne trouve pas celles où il apparaît dans le titre.
Tout ça m'a donné envie de faire mumuse avec Google, et voilà t'y pas que je m'aperçois que nous avons fait notre prépa au même endroit au même moment (mais pas dans la même section, sinon, je t'aurais peut-être reconnue, quand même). Enfin voilà, encore une fois on constate que le monde est très très small :-)
En même temps, selon Google, le seul site à pointer vers le tien est... lui-même ! Dès lors, il semblerait normal qu'Exalead ne le trouve pas. Mais la question, la grande question, est : comment Google l'a-t-il trouvé, alors ? J'ai toujours dit qu'il y avait un truc obscur avec Internet...
Sinon, on peut partir de cette page : http://aixtal.blogspot.com/2006/02/moteurs-et-le-gagnant-est.html et explorer les liens pour les nombreux articles de Jean Véronis sur les moteurs de recherche (mais je n'ai pas remis la main sur celui qui parlait des différences linguistiques - un artefact de mon imagination ? ou une confusion avec ce que le directeur scientifique d'Exalead avait dit lors de la conférence à laquelle j'ai assisté récemment, peut-être).
@ Smyrno : Le monde est petit et les ressortissants de ce lycée pullulent !
@ Mon Ange : Parce que Google ne trie évidemment pas les résultats uniquement par PageRank et que, bien qu'aucun site ne pointe vers ma page, ma page pointe vers d'autres sites et peu ainsi apparaître en referrer, ce qui suffit à leur web crawler pour la trouver.
Je ne vois pas en quoi les referrers changent quelque chose. On doit avoir une notion différente du fonctionnement d'un crawler. Pour moi, le referrer est une information fournie par ton navigateur quand tu arrives sur un site B en venant d'une site A, disant "hey, je viens de A !". Le crawler peut à la limite fournir cette information au site B (s'il inclut cette option du protocole HTTP) mais pour cela, encore faut-il qu'il vienne du site A.
Trois solutions par contre :
Non, en fait j'ai d'autres explication plus plausibles :
Et un dernier point qu'il me faudrait éclaircir : si je suis sur un site A et que je tape l'url d'un site B (manuellement, sans cliquer sur un lien), est-ce que le navigateur remplit le referrer. J'espère bien que non, mais je n'ai jamais vérifié.
@ Mon Ange : Je sais pas si tu te souviens, mais j'en avais déjà donné l'adresse à partir de mon blog. Par ailleurs, je l'ai à plusieurs reprises indiquée sur des choses qui, je crois, sont apparues en ligne.
J'en conclus donc que la fonction link est foireuse (ça peut être une histoire de temporalité).
Et si je ne m'en suis pas rendue compte plutôt (ce qui nous aurait évité cette discussion), c'est peut-être parce que je suis balade.
Surtout des polars. À l'occasion, des romans de fantasy loufoque, du théâtre, de la littérature chinoise traduite en italien (j'ai des amis formidables), des vrais livres bien écrits.
of Montreal, Caravan Palace, the Ditty Bops, Dango Reinhardt, the National, Minor Majority, Léo Ferré, Beethoven, Sonny Rollins, Laura Marling, Erlend Øye, Hjaltalin, Sufjan Stevens, Yuri Bashmet. Entre (nombreux) autres.
occupée ouh là beaucoup très très, enchantée par Oscar Wilde (One should always be a little improbable), vaguement improbable, toujours aussi liberté, égalité, schtroumph 1er (merci Plantu).
"Partir, c'est mourir un peu. Mais mourir, c'est partir beaucoup."
[Alphonse Allais]
Blog garanti sans conservateurs.
Déconseillé aux moins de 36 mois.
A manipuler avec précaution.
Attention, chaton méchant.*
* Rayer les mentions inutiles.