Rollyo : Moteur de recherche sur la blogosphère belge

J’ai pris quelques minutes pour jouer avec Rollyo, le service de personnalisation de recherche, pour réaliser un vieux rêve… tenter de mettre en place un moteur de recherche dédié à la blogosphère belge.

Après une première recherche je me suis rendu compte que l’effort n’avait pas encore été fait, bien que de belles initiatives existent déjà pour cerner notre beau pays (en plus de sa carte).

Sur base des blogs ou plateformes de blogs que je connais, de ce qui est techniquement possible avec l’application, mon premier jet se trouve à l’adresse suivante: http://rollyo.com/quinze/belgian_blogosphere/

Toute suggestion peut-être faite, tout manquement dénoncé en commentaire ci-dessous.

7 réflexions sur « Rollyo : Moteur de recherche sur la blogosphère belge »

  1. J’y pense… je vais ajouter le lien vers ce search engine à partir de la carte Frappr. J’en suis l’admin, cela devrait être possible.

  2. Il est clair que l’outil comporte une limitation drastique à 25 sites, difficile donc d’être exhaustif ce qui est pourtant le fond de mon envie.

    Cet essai souffre également d’un manque d’outil fédérateur dans la blogosphère belge.
    Pour aller au delà il faudrait syndiquer et indexer tous les flux RSS des 20.836 blogs que blogium.be suit, plus les 77.778 skynetblogs créés à ce jour, plus… plus permettre l’ajout de flux si certains se sentent oubliés 🙂
    Un petit technorati / blogsearch de chez nous.

  3. En fait, si on pouvait trouver une liste de tous les RSS disponibles… je pourrais peut-être aider à fournir le moteur de recherche "Belgian blogs" via un ami… J’investige…

  4. Bonjour,
    Je suis tombé sur cette conversation vieille de cinq ans mais je n’ai pas pu m’empêcher de répondre.

    Gaetano dit « […] si on pouvait trouver une liste de tous les RSS disponibles…[…] »
    Et bien, ce n’est pas trop compliqué à mettre en oeuvre.

    La meilleure idée serait de concevoir un petit Crawler en respectant le principe suivant :
    Pllutôt que de fouiller les sites en profondeur afin de les indexer (like google ),
    le crawler s’arrêterait au page d’accueil des blogs (où souvent le flux RSS est proposé ), enregistrerait l’adresse du flux.
    Une fois cette opération effectuée, le crawler n’aurait de cesse de trouver sur la page principale des liens qui le conduisent, non pas dans les articles du blog, mais vers la page d’accueil d’un autre blog où il répeterait la même méthode.

    Maintenant pour se limiter aux blogs belges, ce n’est pas bien compliqué.
    Il faudrait mettre des conditions dans les URL que le crawler suivrait
    et/ou faire un « nettoyage » avec recherche de pattern à éléminer dans la liste finale des flux RSS
    recueillis par le crawler.

    Cependant, je ne me suis pas renseigné, mais j’imagine
    que l’idée d’un moteur de recherche pour blogs belges a déjà été développé.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.