#26 Le 22/05/2007, à 17:35
- gdoumenc
Re : google libre ?
selon moi si on veut une alternative on doit trouver le moyen d'offrir des infos plus pertinante. viser les objectifs que google n'a pas encore atteind
Totalement d'accord... Mais lesquels? On est sur de la pertinence d'infos..
Hors ligne
#27 Le 22/05/2007, à 17:41
- climu
Re : google libre ?
Le sujet de mon post etait de savoir si il etait possible de faire un moteur de recherche libre.
Je pense qu'on est tous convaincu que c'est dificile, mais faisable.
On en ai maintenant a discuter comment classer les sites.
Je pense que cette question se posera plus tard, une fois le projet lancé.
Au départ, personne ne cherchera a casser ses concurents car nou seront tres peu connu.
De plus,face a ce probleme, Des miliers de petits serveaux trouveront bien une solution.
Il faut réussir a lancer se projet!
Hors ligne
#28 Le 22/05/2007, à 17:44
- ByRoot
Re : google libre ?
Selon moi le moyen le plus simple est de faire Dans le style wiki, un moteur de recherche participatif, c'est ce qui peut donner le plus de résultat avec de petits moyens et assez rapidement.
Un truc dans le style: Je trouve une page super sur tel ou tel sujet, et je vais la référencer correctement sur le moteur en la notant et la définissant sur de nombreux critères prédéfinis et combinables.
Apres le plugin serait utile pour référencer, d'un click une fiche apparait et nous permet de saisir les données rapidement.
C'est l'idée que je me fait du truc, et c'est dans le domaine du réalisable sans gros moyen (un seul serveur peut suffir puisque en fin de compte il n'hébergerait qu'une base de donnée assez réduite, les données lui arrivent déja traitée il n'a qu'a les enregistrer)
Apres il n'y a plus qu'a éspérer que les utilisateurs seront aussi respectueux que ceux de wiki
Hors ligne
#29 Le 22/05/2007, à 17:46
- ByRoot
Re : google libre ?
ByRoot a écrit :Le plugin est selon moi une bonne idée, mais pas pour partager des ressources. Perso je verais plus un outils pour associer des mot clés et des notes a des sites. Ou mieu utiliser ces donnée pour retraiter les résultat de google.
noter la pertiances des mots clés voir en proposer, serait efficasse mais un retombe sur le problème de ceux qui chercherai à "casser" le référencement de leurs concurents et comme ils chercheraient tous à en faire autant, ça finirai par être un vrai bordel...
J'ai jamais vu encarta ou universalis aller flooder wikipédia.
Hors ligne
#30 Le 22/05/2007, à 17:59
- synopsis
Re : google libre ?
synopsis a écrit :un moteur de recherche libre... les/un créateur(s) de wikipédia avait lancé l'idée d'un moteur communautaire, au lieu de développer des robots, chaque utilisateur aurai été un "robot de référencement de site web", l'idée avait l'aire sympa mais elle a été abandonné il me semble (sans trop savoir pourquoi),
Wikipedia est en partie hebergée par google.
Y a-t-il une relation de cause à effet?
bonne question...
synopsis a écrit :...parceque autrement on ne disposera jamais du millième des moyens techniques de google (si le but est de le contrer c'est mal partie)
Les moyens lociciels?
Aucun editeur au monde n'a les moyens du libre en matière de developement!(*)Les moyens materiels?
Le plus gros parc informatique du monde est celui des PCs domestiques!(*)
ma remarque était dans le cadre d'un google-like, même techniquement possible, j'imagine mal comment motiver suffisament de monde pour disposer de quoi lancer autant de robot avec la même efficassité, et la même réactivité que google, après je suis peut être pessimiste sur ce point.
mais ça ne signifie pas qu'il n'y a pas de solution, mais je pense qu'il est inutile de chercher à suivre le même modèle de fonctionnement que google. on ne pourra s'en sortir que par l'innovation...
Nous(**) sommes plus puissants que Microsoft et Google réunis mais nous n'en avons pas conscience.
Microsoft et google (entre autre... mais on en retrouve dans chaque domaine) ont un controle sur l'inertie des utilisateurs, cette inertie est essentiellement basée sur l'inculture et la prodigieuse capacité de l'être humain a être conditionné (qui vont de paire), si tu penses avoir une solution contre ça appel moi...
#31 Le 22/05/2007, à 18:08
- synopsis
Re : google libre ?
selon moi si on veut une alternative on doit trouver le moyen d'offrir des infos plus pertinante. viser les objectifs que google n'a pas encore atteind
Totalement d'accord... Mais lesquels? On est sur de la pertinence d'infos..
pour moi l'objectif de google est de profiler chaque utilisateur, prendre le pas sur cette idée signifierait que chaque utilisateur face lui même son propre profile pour pouvoir éffectuer des recherches... mais est ce bien raisonable ???
#32 Le 22/05/2007, à 18:22
- synopsis
Re : google libre ?
Selon moi le moyen le plus simple est de faire Dans le style wiki, un moteur de recherche participatif, c'est ce qui peut donner le plus de résultat avec de petits moyens et assez rapidement.
Un truc dans le style: Je trouve une page super sur tel ou tel sujet, et je vais la référencer correctement sur le moteur en la notant et la définissant sur de nombreux critères prédéfinis et combinables.
Apres le plugin serait utile pour référencer, d'un click une fiche apparait et nous permet de saisir les données rapidement.
C'est l'idée que je me fait du truc, et c'est dans le domaine du réalisable sans gros moyen (un seul serveur peut suffir puisque en fin de compte il n'hébergerait qu'une base de donnée assez réduite, les données lui arrivent déja traitée il n'a qu'a les enregistrer)
Apres il n'y a plus qu'a éspérer que les utilisateurs seront aussi respectueux que ceux de wiki
oui il me semble que c'était a peu près l'idée du mec de wikipédia... dont on ne sait toujours pas pourquoi s'est tombé a l'eau...
après ce n'est plus vraiment un moteur de recherche, mais peu importe si le résultat et là, chaque utilisateur deviendrait une partie du moteur en somme
(sinon, le flood ne s'applique pas vraiment dans le domaine des wiki, je faisais référence au fait que les pages wikipédia vérouillés pour vandalisme c'est pas ce qui manque, même si les motivations sont plus souvent politiques ou religieuses, ce qui est logique puisqu'il sagit d'un univers plus culturel que commerciale, mais quand on vois l'argent dépensé par certaines entreprises pour des mots clés, je me demande quel moyen elles méttrait en ouevre pour jouer sur une base de donnée plus ou moins libre d'accés)
#33 Le 22/05/2007, à 19:01
- climu
Re : google libre ?
Je pense qu'au départ, on devrait construire un truc simple qui marche, et qui soit libre.
Apres on l'améliore pour qu'il surpasse google. Comme ca les gens auront quelque choses sur quoi travailler...
Niveau profil:
esque c'est nécéssaire?
Moi je suis plus pour un truc qui renvoit la meme choses a tout le monde (a discuter...).
Mais meme, il suffirait que les gens s'inscrive et remplisse un petit formulaire pour pouvoir l'utiliser (je suis pas pour ca perso).
Et sinon, Il suffit de faire un logiciel qui a partir d'une liste d''adresse peut les classer tout seul, et faire le lien mot clef->resultat.
comme ca impossible d'influencer pour tel ou tel site.
Parceque si les utilisateurs peuvent enregistrer les sites en mettant des donné, effectivement, des gens vont en profiter pour se faire de la pub.
Je pense qu'il ne faut pas que l'on puisse modifier le logiciel directement sur internet pour pouvoir éviter le petit con qui foutent la merde.
Mais plus le développer comme du libre.
ca serait surtout le logiciel qui serait libre, la base de donné se générerait et se mettrait a jour toute seule avec les plugin.
Pour conclure:
Il faudrait créer un site ou on pourait discuter de cela, et proposer des logiciels qui réponde a ca, et expliquer au gens ce qu'on veut faire...
Si vous etes motivé bien sur...
et comment créer se site?
je ne sais pas faire.
il nous faut pleins de gens en tout cas.
Hors ligne
#34 Le 22/05/2007, à 19:15
- gdoumenc
Re : google libre ?
pour moi l'objectif de google est de profiler chaque utilisateur, prendre le pas sur cette idée signifierait que chaque utilisateur face lui même son propre profile pour pouvoir effectuer des recherches... mais est ce bien raisonnable ???
Exact pour l'idée, mais pas raisonnable car contrairement à Wikipedia, si tu mets n'importe quoi cela peut t'être utile en générant du trafic sur ton site.. Et si tu demande à d'autres de juger (indirectement) tu rentres dans l'idée d'un forum du genre "j'ai testé pour vous".. bof...
Par contre je crois comprendre une idée d'une sorte de peer2peer de moteur... un truc du genre chaque utilisateur peut prendre en charge un mot clé et se charge de fournir les sites pour ce mot.. Donc la puissance de recherche explosée sur chaque machine perso.. Ca a un sens?
Hors ligne
#35 Le 22/05/2007, à 19:47
- synopsis
Re : google libre ?
oyé oyé, pour la solution wiki :
ça devait s'appeler wikiasari et tuer google début 2007, de plus on trouve tout un tas d'article sur le sujet, seul problème ces articles dates de 2006...
mais si on recherche wikiasari dans google, le deuxième lien nous amène sur :
"La recherche est une partie fondamentale de l'infrastructure d'Internet. Et elle est actuellement défectueuse.''
Pourquoi ? Elle est défectueuse de la même façon que le logiciel propriétaire est défectueux : manque de liberté, manque de communauté, manque de responsabilité, manque de transparence. Ici, nous allons changer tout ça...
pour lire la suite :
http://search.wikia.com/wiki/Search_Wikia/fr
(en réalité on arrive sur la page englaise mais bon...)
donc si j'ai bien compris, le projet s'appelerai wikia, comme attendu de la part d'un wiki c'est plus un annuaire qu'un moteur de recherche, j'ai pas encore eu le temps de jouer avec pour tester sa pertinance, et il serait moins mort que sous médiatisé...
pour la solution moteur révolutionnaire :
@gdoumenc : je réfléchie à la question...
#36 Le 22/05/2007, à 20:58
- synopsis
Re : google libre ?
retour au point mort ou presque...
après test de wikia, j'ai eu la vague impression que si l'idée de départ n'était pas mauvaise, il n'en reste qu'un gros flan... deuxième impression, quand on fait une recherche sur le net elle est sous traité par... google !?!... passé dans un état de perplexité avancé, j'ai demandé à wikipédia qui est plus ou moins lié, ce qu'il sen été, et là... c'est le drame. wikia n'est plus l'annuaire communautaire qu'il révé d'être, mais il est devenu un ébergeur de wiki gratuit... (comme la désencyclopédie) subventionné par la pub google.....
de tous celà on retiendra qu'il existe deux projets de moteur open source : Lucene dont est dérivé Nutch
http://fr.wikipedia.org/wiki/Lucene
http://fr.wikipedia.org/wiki/Nutch
#37 Le 22/05/2007, à 21:46
- synopsis
Re : google libre ?
synopsis a écrit :pour moi l'objectif de google est de profiler chaque utilisateur, prendre le pas sur cette idée signifierait que chaque utilisateur face lui même son propre profile pour pouvoir effectuer des recherches... mais est ce bien raisonnable ???
Exact pour l'idée, mais pas raisonnable car contrairement à Wikipedia, si tu mets n'importe quoi cela peut t'être utile en générant du trafic sur ton site.. Et si tu demande à d'autres de juger (indirectement) tu rentres dans l'idée d'un forum du genre "j'ai testé pour vous".. bof...
Moi je voyais une gestion du profil au niveau du navigateur, tu sélectionnerais un certain nombre de mots clés pour te qualifier.... ou d'une manière générale pour catégoriser le cadre de la recherche que tu effectus et qui peut très bien varier d'une recherche à l'autre (professionnel/personel/loisir/hobbie/contrainte/commercial/familial/acteur/spectateur/newbie etc etc). Ces informations seraient intégrés par le moteur de recherche comme une dimension suplémentaire à ta recherche, ça reviendrai à donner des "sous entendu" aux mots clés que tu utilises pour ta vrai recherche... (éventuellement modifiable en temps réel pour pofiner ta recherche, les mots clés de recherche n'étant pas nécessairement sensible aux même mots clés de profils)
l'idée globale : "dis nous qui tu es pour qu'on adapte ta recherche" "... et la publicité" me souffle google...
Par contre je crois comprendre une idée d'une sorte de peer2peer de moteur... un truc du genre chaque utilisateur peut prendre en charge un mot clé et se charge de fournir les sites pour ce mot.. Donc la puissance de recherche explosée sur chaque machine perso.. Ca a un sens?
oui ça a un sens (enfin a priori) mais me semble plus être une méthode qu'une fin en soit. L'idée restant apparament la même que celle vue plus haut, que chaque utilisateur deviendrai une partie du moteur.
Si on part de l'idée que pour chaque site visité, le navigateur nous demande de proposer/noter les mots clés du site, j'ai du mal à imaginer la puissance nécessaire pour gérer les résultats de façon centralisé... vu le nombre de site internet on risque de cramer le serveur en très peu de temps, le principe du p2p permettrai probablement d'éviter le problème....
#38 Le 22/05/2007, à 22:29
- climu
Re : google libre ?
pour commencer, nutch parrait solide et libre.
Il suffit de l'heberger sur un serveur et de créer une base donnée, et cela nous fait un moteur libre!
pour la base de donnée, le robot intégré a firefox qui envoi les site au serveur suffit!
Pas besoin de demander des mots clef!
donc le serveur ne brulle aps parcque tout ce qui se passe, c'est qu'il recoi des addresse, qu'il doit ajouter a sa base de donner.
apres nutch se débrouille de tout!
On peut ensuite le modifier pour ajouter les histoire de personalisation qui m'on l'air atrayante.
Moi je voyais une gestion du profil au niveau du navigateur, tu sélectionnerais un certain nombre de mots clés pour te qualifier.... ou d'une manière générale pour catégoriser le cadre de la recherche que tu effectus et qui peut très bien varier d'une recherche à l'autre (professionnel/personel/loisir/hobbie/contrainte/commercial/familial/acteur/spectateur/newbie etc etc). Ces informations seraient intégrés par le moteur de recherche comme une dimension suplémentaire à ta recherche, ça reviendrai à donner des "sous entendu" aux mots clés que tu utilises pour ta vrai recherche... (éventuellement modifiable en temps réel pour pofiner ta recherche, les mots clés de recherche n'étant pas nécessairement sensible aux même mots clés de profils)
C'est exelent ca !!
genre dans un coin, il suffit de cocher certaines case pour profiler sa recherche.
+1 pour cette idée (n'en parlé pas trops fort, il faudrait aps que google la brevete!)
Et que pensez vous de vous baser sut nutch pour commencer. Il est libre et d'aussi bonne qualité que google.
Ensuite on l'améliore a notre sauce.
Pour le p2p, j'ai lut chez nutch que c'était forcément plus lent (a vérifier).
Reste deux points:
-le robot intégré a firefox qui envoi les site au serveur ou pas (qu'en pensez vous?).
-les serveurs...
Fixon un truc tout de suite: pas de pub ? Pour moi c'est l'objectif donc pas de pub. on est d'accord la dessu?
Hors ligne
#39 Le 23/05/2007, à 00:19
- synopsis
Re : google libre ?
C'est exelent ca !!
genre dans un coin, il suffit de cocher certaines case pour profiler sa recherche.+1 pour cette idée (n'en parlé pas trops fort, il faudrait aps que google la brevete!)
merci, mais comme je me base sur une extrapolation des "phantasmes googleliens" ça m'étonerait que ce ne soit pas déjà déposé... (la semaine dernière ils ont déposé "l'analyse des comportements des joueurs en ligne" pour déterminer quel pub serait la plus adapté) d'un autre coté, les brevets sur les idées n'ont de valeur qu'aux usa...
ensuite, l'idée peu sembler séduisante, mais elle est plus facile à dire qu'à faire, à vu de nez et à titre personnel, je pourrai passer des jours/semaines/mois à chercher un algo qui converge sans jamais le trouver... (juste théorique, sans même penser à l'implémenter et à l'intégrer dans un programme qui m'est inconnu) mais je n'suis pas une référence...
après la première étape est de décrire le problème le plus précisément possible (mathématiquement parlant), ce que je n'ai pas fait, si tu as un début d'idée je suis preneur...
Et que pensez vous de vous baser sut nutch pour commencer. Il est libre et d'aussi bonne qualité que google.
Ensuite on l'améliore a notre sauce.
j'en pense est que la première étape (enfin à mon niveau) serait d'utiliser/contacter des moteurs basés sur nutch et de chercher à savoir les problèmes qu'ils rencontrent. Pourquoi n'ont ils toujours pas dépassé google, et estimer les montagnes de boulo que sa représenterai de combler l'écard, ceci afin d'envisager un calendrier hypotétique et une estimation du nombre de personne bénévolle nécessaire au projet. Dans la foulé avoir une idée plus complète du projet (autre chose que du théorique... on en revient à la description) et leur demander leur avis sur son intéret et sur sa faisabilité...
comme eux par exemple http://www.misterbot.fr/
(en fait la vrai première étape est de décortiquer un moteur de recherche)
Pour le p2p, j'ai lut chez nutch que c'était forcément plus lent (a vérifier).
ya des chances pour que ce soit le cas.
Reste deux points:
-le robot intégré a firefox qui envoi les site au serveur ou pas (qu'en pensez vous?).
-les serveurs...
oui il faudrait pouvoir transmettre tous les sites visité par un utilisateur automatiquement (sans pour autant pister l'utilisateur) juste pour obtenir les sites. mais ça n'est qu'une étape... le vrai boulo est de les classer.
Fixon un truc tout de suite: pas de pub ? Pour moi c'est l'objectif donc pas de pub. on est d'accord la dessu?
a oui tiens ça serait quoi le status juridique ???
#40 Le 23/05/2007, à 00:47
- climu
Re : google libre ?
niveau juridique, je m'y connait pas du tout.
Quesque tu veux dire? On serait sous GPL ou truc comme sa. Mais On a pas besoin d'etre quelque chose (genre assoc si c'est ce que tu veu dire) juridiquement pour dévelloper sa (sauf si je me trompe?).
J'avais déja regarder misterobt, mais je crois que c'est juste une entreprise privé qui utilise nutch.
Donc je sais pas trops si ils voudront nous aider.
Et niveau nutch, ils disent clairement dans la faq qu'il font jute un algorithme de recherche et que pour fair un moteur, ils le laissent a des companies privées.(pourquoi faire les choses a moitié?).
Et le résultat de misterbot est assez décevant je trouve: lent et peu pertinent.
Esceque c'est nutch ou misterbot qui est a metre en cause? Les critiques de nutch semblaient glorieuses.
Je suis daccord, il faudrait décrire présimement le probleme.
On pourait commencer par résumer ce sur quoi on s'est mi daccord sur se forum pour pouvoir trouver de l'aide.
genre
-Créer un moteur libre qui profile les recherches de maniere interactives.
- Un pulgin tout simple qui envoi les adresses a un serveur (il faudrait qu'il ait une liste sur sur l'ordi pour ne pas envoyer 20 fois apr jour la mem page!).
Et essayer de trouver des moteurs basé sur nutch et les contacter (g rien trouvé d'autre que misterbot).
On peut toujours contacter directement nutch pour demander de l'aide a ses developeurs. Eux ils doivent un peu s'y connaitre.
Alors c'est sérieux on essaye?
Je crois qu'on est 2 pour l'instant.
Bon je vais dormir.
nb: je suis en partiel en se moment donc ca va etre chaud d'etre tres mobilisé...
Dernière modification par climu (Le 23/05/2007, à 00:47)
Hors ligne
#41 Le 23/05/2007, à 03:34
- Henry de Monfreid
Re : google libre ?
Je pense qu'il serait temps de déplacer cette conversation dans: Développement - Programmation
« Je te hais plus qu'aucun des dieux qui vivent sur l'Olympe
Car tu ne rêves que discordes, guerres et combats. »
Trouble obsessionnelcompulsif
Le TdCT est revenu (ils reviennent tous), pour y accéder, demandez à nany ou moi.
Hors ligne
#42 Le 23/05/2007, à 08:08
- gdoumenc
Re : google libre ?
Moi je voyais une gestion du profil au niveau du navigateur, tu sélectionnerais un certain nombre de mots clés pour te qualifier.... ou d'une manière générale pour catégoriser le cadre de la recherche que tu effectus et qui peut très bien varier d'une recherche à l'autre
Je crois comprendre autre chose :
C'est un moteur hierarchisé par catégories. On a donc une sorte de portail d'inscription avec création d'une "fiche" de description et un moteur d'indexation associé à ta fiche (on pourrait "vérifier" que la fiche et le contenu correspondent). Ainsi (si cela marche) on obtient pas en résultat d'une recherche une liste, mais un catalogue structuré de réponses..
Mais, on est plus dans le cas d'un moteur robot qui prends tout les contenus en "temps-réel" mais dans le cas d'une approche de type catalogue "pages jaunes". Je me trompe?
L'idée restant apparament la même que celle vue plus haut, que chaque utilisateur deviendrai une partie du moteur.
Il y a deux notions dans le p2p pour ce type d'application : celle d'exécution (trop tôt pour en parler), celle de structuration/manipulation (celle que je mentionnais). Dans cette approche, chaque catégorie (et sous catégorie..) a son propre portail de description/son moteur/... (adaptée au domaine). On pourrait considérer que la gestion de chacune de ces catégories (définition des mots clés, renseignements utiles, ..) sera à la charge d'une personne du "réseau". Comme pour Wikipedia, je deviens le responsable de la catégorie informatique/logiciel/moteur de recherche et je gère cette sous-partie du moteur.
J'ai rien compris?
A voir...
Hors ligne
#43 Le 23/05/2007, à 10:46
- Christophe Durandeau
Re : google libre ?
Juste une idée en passant.
Pour catégoriser les sites, pouquoi ne pas utiliser (entre autre) le résultat de la recherche de l'utilisateur ?
Par exemple, je tapes "forum ubuntu" et le moteur me sort une liste de sites. Le moteur considère alors que le lien sur lequel je cliques correspond le mieux à ces mots clé.
L'odre d'affichage des sites par le moteur ne serait donc plus en fonction de la popularité du site sur internet (méthode google) mais en fonction de la pertinence des mots clé.
Quand je tape "recette tarte au camembert" j'obtiens la liste des sites que les autres utilisateurs ont sélectionnés en tapant ces mots clé.
Sinon je ne crois pas trop à l'idée de demander à l'utilisateur de catégoriser lui même les sites. On peut cependant utiliser ses bookmarks. Normalement ils sont plus ou moins classés et on peut en tirer quelques mots clé. Et des sites se trouvant dans le même dossier seront considérés comme ayant certaines similitudes.
Concernant le moteur de recherche lui même, il n'y avait pas un projet européen avec une recherche sémantique ? Il y a certainement des labos de recherche qui travaillent sur quelque chose de comparable et ce serait une voie intéressante. Car google n'est quand même pas très intelligent dans son analyse. Il ne fait que du mot à mot et de la statistique. Il ne cherche pas à "comprendre" le contenu de la page. Ce sera à mon avis, la prochaine génération des moteurs de recherche.
JARDIN DE PIXELS, création de sites internet sur Bordeaux
Hors ligne
#44 Le 23/05/2007, à 11:35
- climu
Re : google libre ?
Et si on a les petits boutons de profil: travail/loisir.
On peut les utiliser pour affiner les résultat, et pour catégoriser les sites:
si quelqu'un choisis tel site alors qu'il est en "mode loisir" , on augmente la "cote" loisir de se site" ( on le catégoris un peu comme loisir).
Donc il apparaitra plus haut si la personne a coché loisir que travail.
Comme sa, sa se régule tout seul.
Comment passer ca dans programmation?
Hors ligne
#45 Le 23/05/2007, à 11:49
- climu
Re : google libre ?
C'est un moteur hierarchisé par catégories. On a donc une sorte de portail d'inscription avec création d'une "fiche" de description et un moteur d'indexation associé à ta fiche (on pourrait "vérifier" que la fiche et le contenu correspondent). Ainsi (si cela marche) on obtient pas en résultat d'une recherche une liste, mais un catalogue structuré de réponses..
Mais, on est plus dans le cas d'un moteur robot qui prends tout les contenus en "temps-réel" mais dans le cas d'une approche de type catalogue "pages jaunes". Je me trompe?
dmoz c'est déja un peu ca...
Esque ta presentation des résultas est mieu? moi je vote pour non, mais il faudra décider de sa...
Au pire, vu qu'on est aprti pour catégorisé un peu les sites, on peu proposer un mode réponse globale, et un mode par catégorie...
En utilisant le meme moteur, mais en présentant différemment les résultats.
C'est une idée, je c'est pas si c'est bien....
Hors ligne
#46 Le 23/05/2007, à 12:19
- synopsis
Re : google libre ?
synopsis a écrit :Moi je voyais une gestion du profil au niveau du navigateur, tu sélectionnerais un certain nombre de mots clés pour te qualifier.... ou d'une manière générale pour catégoriser le cadre de la recherche que tu effectus et qui peut très bien varier d'une recherche à l'autre
Je crois comprendre autre chose :
C'est un moteur hierarchisé par catégories. On a donc une sorte de portail d'inscription avec création d'une "fiche" de description et un moteur d'indexation associé à ta fiche (on pourrait "vérifier" que la fiche et le contenu correspondent). Ainsi (si cela marche) on obtient pas en résultat d'une recherche une liste, mais un catalogue structuré de réponses..
Mais, on est plus dans le cas d'un moteur robot qui prends tout les contenus en "temps-réel" mais dans le cas d'une approche de type catalogue "pages jaunes". Je me trompe?
C'est une solution, mais je pense que la fiche aura besoin d'être modifié à la demande de l'utilisateur, car un même utilisateur peux effectuer des recherches dans des cadres différents, voir même au besoin de l'algo s'il trouve plusieur catégorie de solution,
exemple caricatural : "vous avez recherchez un coiffeur : êtes vous un homme / une femme / un enfant / un animal ??"
une fiche bien faite devrait donner ce genre de renseignement... mais imagines une femme qui chercherait un coiffeur pour son maris... la fiche rigide peu représenter un handicap pour le coup, il faudrait en reconstruire une à chaque recherche.... à partir de ces propres anciennes fiche et de celles d'autre recherche.
Juste une idée en passant.
Pour catégoriser les sites, pouquoi ne pas utiliser (entre autre) le résultat de la recherche de l'utilisateur ?
une idée intéressante, analyser les recherche comme des chaine de markov : à un mot clé donné, quelle est la probabilité des mots clé suivant (en cas de recherche infructueuse).
mais quelque part ça m'étonnerai que personne n'en ai eu l'idée.
Il y a deux notions dans le p2p pour ce type d'application : celle d'exécution (trop tôt pour en parler), celle de structuration/manipulation (celle que je mentionnais). Dans cette approche, chaque catégorie (et sous catégorie..) a son propre portail de description/son moteur/... (adaptée au domaine). On pourrait considérer que la gestion de chacune de ces catégories (définition des mots clés, renseignements utiles, ..) sera à la charge d'une personne du "réseau". Comme pour Wikipedia, je deviens le responsable de la catégorie informatique/logiciel/moteur de recherche et je gère cette sous-partie du moteur.
je n'sais pas pourquoi ça me fait pensé au développement de BSD...
c'est une démarche qui a le mérite d'être fiable, et qui permet d'éviter pas mal de dérive, mais ne risque t elle pas d'être longue à mettre en place ?? a moins de disposer de la capaciter de donner ses droits à d'autre utilisateurs créant ainsi une sorte de "réseau de confiance".... ce qui correspondrait plus au développement de linux.... c'est ça l'idée du peer ??
Concernant le moteur de recherche lui même, il n'y avait pas un projet européen avec une recherche sémantique ? Il y a certainement des labos de recherche qui travaillent sur quelque chose de comparable et ce serait une voie intéressante. Car google n'est quand même pas très intelligent dans son analyse. Il ne fait que du mot à mot et de la statistique. Il ne cherche pas à "comprendre" le contenu de la page. Ce sera à mon avis, la prochaine génération des moteurs de recherche.
je ne sais pas mais c'est fort possible, mais très difficile à réaliser sans intervention de la part de utilisateur, nous avons tous plus ou moins nos propre définission pour chaque mot, si l'utilisateur n'explicite pas les siennes on peu tourner en rond longtemps, a moins de développer un système "expert" ayant des capacités d'analyse générales supérieure à l'utilisateur ???
il faudrait voir où en sont ces recherches pour se faire une idée.
#47 Le 23/05/2007, à 12:59
- synopsis
Re : google libre ?
niveau juridique, je m'y connait pas du tout.
Quesque tu veux dire? On serait sous GPL ou truc comme sa. Mais On a pas besoin d'etre quelque chose (genre assoc si c'est ce que tu veu dire) juridiquement pour dévelloper sa (sauf si je me trompe?).
moi non plus je ne mi connais pas, et on peut très bien coder chez soi sans justification, mais il faut bien exister d'une manière ou d'une autre... déposer un nom de domaine une marque..... (mais bon, pour moi, on est encore très loin de ça)
Alors c'est sérieux on essaye?
Je crois qu'on est 2 pour l'instant.
je pense qu'a deux on n'est pas sérieux, mais il ne tiendrai qu'à nous de le devenir... à vue de nez, pour l'être il faut commencer par étudier tous ce qui a été fait sur le sujet (histoire d'éviter de "réinventer la roue"), et de dissèquer les méthodes existantes (ce qui peut être jouable en quelque mois). Et ensuite on voie si nos belles théories développés ici sont 1) innovantes, 2) applicables, et si la réponse et oui, là on commence à être sérieux...
mais pourquoi pas.
#48 Le 23/05/2007, à 13:18
- dada55
Re : google libre ?
SI vous voulez des informations sur le côté juridique de votre projet, posez moi vos questions, je peux essayer d'y répondre
Hors ligne
#49 Le 23/05/2007, à 13:36
- gdoumenc
Re : google libre ?
Juste une idée en passant.
Pour catégoriser les sites, pouquoi ne pas utiliser (entre autre) le résultat de la recherche de l'utilisateur ?
C'est ce que que fait Google... Sinon regarde plutot vers Synomia..
la fiche rigide peu représenter un handicap pour le coup, il faudrait en reconstruire une à chaque recherche
Je pense qu'il y a une forte confusion entre la "fiche d'index" et la "fiche de requête"... Je parle de l'un et tu parle de l'autre... Or l'autre doit être "matché" à l'un...
Hors ligne
#50 Le 23/05/2007, à 13:51
- Christophe Durandeau
Re : google libre ?
Le moteur de recherche Européen c'est le projet Quaero, qui a donné Exalead. Bof...
Je viens de découvrir Valiz qui est un moteur de recherche sémantique open-source.
http://www.valiz.org/
Ou bien hakia
http://www.reivilo.net/index.php/2006/04/08/60-hakia-la-nouvelle-generation-des-moteurs-de-recherche
http://www.hakia.com/
A mon avis, quant à vouloir faire un nouveau moteur de recherche, autant partir sur des technologies plus récentes que la force brute telle que google. Non ?
Un autre article (de 2003 mais intéressant quand même) sur le fonctionnement du pagerank de google :
http://www.webmaster-hub.com/publication/Vers-un-moteur-de-recherche.html
http://www.webmaster-hub.com/publication/Vers-un-moteur-de-recherche,54.html
http://www.webmaster-hub.com/publication/Vers-un-moteur-de-recherche,55.html
JARDIN DE PIXELS, création de sites internet sur Bordeaux
Hors ligne