<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
	<channel>
		<atom:link href="http://forum.ubuntu-fr.org/extern.php?action=feed&amp;tid=412909&amp;type=rss" rel="self" type="application/rss+xml" />
		<title><![CDATA[Forum Ubuntu-fr.org / Alternative libre au moteur de recherche Google ?]]></title>
		<link>http://forum.ubuntu-fr.org/viewtopic.php?id=412909</link>
		<description><![CDATA[Les sujets les plus récents dans Alternative libre au moteur de recherche Google ?.]]></description>
		<lastBuildDate>Mon, 05 Nov 2012 14:15:19 +0000</lastBuildDate>
		<generator>FluxBB</generator>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11400451#p11400451</link>
			<description><![CDATA[<div class="quotebox"><cite>Haleth a écrit&#160;:</cite><blockquote><div><p>Dans un futur proche, je pense que ce genre de projet est voué à l&#039;echec, à moins de ne parser qu&#039;une partie du Web (et encore..): encore faut-il définir ce qui mérite d&#039;être indexé, et ce qui ne le mérite pas.</p></div></blockquote></div><p>C&#039;est là qu&#039;est la partie intéressante de la chose. Il faut analyser le moins possible de pages, mais analyser les pages les plus importantes a minima. Donc, plus on analyse ces pages, et plus on a de chances de répondre de manière satisfaisante à l&#039;utilisateur =&gt; Il trouve une page liée à sa recherche et contenant des infos intéressantes. C&#039;est là que Google a marqué des points avec son pageRank.</p><p>Par contre, même sans censure, cela fait qu&#039;on n&#039;est pas toujours capable de proposer un site correspondant à une recherche... Mais apparemment, ça ne gêne pas grand monde <img src="http://forum.ubuntu-fr.org/img/smilies/big_smile.png" width="15" height="15" alt="big_smile" /></p><p>PS: j&#039;ai commencé un script pour vérifier ce que je lis à droite et à gauche (des thèses et des théories, et des algos testés et approuvés, ainsi que des stats). C&#039;est très marrant <img src="http://forum.ubuntu-fr.org/img/smilies/smile.png" width="15" height="15" alt="smile" /></p>]]></description>
			<author><![CDATA[dummy@example.com (Mindiell)]]></author>
			<pubDate>Mon, 05 Nov 2012 14:15:19 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11400451#p11400451</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11358271#p11358271</link>
			<description><![CDATA[<p>Non, mais attendez, je sais que l&#039;index est distribué, forcément. Mais, pour moi, distribuer l&#039;index c&#039;est dire que la &quot;solution&quot; à telle requête se trouve sur un noeud précis (ou plusieurs pour être tranquille, mais en entier à chaque fois). Donc, il faut, à un moment donné, lier à une requête une liste complète d&#039;urls. C&#039;est ça qui me pose le plus question en fait parce que quand je réclame la solution à une requête, le serveur qui me répond doit trouver le bon noeud et celui-ci doit me retourner un début de liste et être capable de me fournir la liste entière.</p><p>De plus, les urls possibles risquent d&#039;être dupliquées à travers le réseau... ou pas, je vais y réfléchir...</p><p>@ArkSet: comme le dit Haleth, et à mon avis, Google utilise un cluster (plusieurs répartis à travers le monde, mais tu n&#039;en interroges qu&#039;un seul à la fois). Et ça c&#039;est tout de même vachement plus costaud qu&#039;un réseau PaP, y a rien à dire.</p><p>@Haleth: Google lui-même ne parse qu&#039;une partie du web, le tout est de tenter de parser la &quot;plus intéressante&quot; en premier pour faire de bons retours à l&#039;utilisateur. Et pourquoi tu penses que c&#039;est voué à l&#039;échec sinon ?<br />Enfin, pour le réseau PaP la duplication n&#039;est pas du tout infinie, ça serait stupide, elle est répartie le moins possible, au contraire...</p>]]></description>
			<author><![CDATA[dummy@example.com (Mindiell)]]></author>
			<pubDate>Thu, 01 Nov 2012 20:17:28 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11358271#p11358271</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11356071#p11356071</link>
			<description><![CDATA[<p>C&#039;est un projet interessant<br />Je me demande s&#039;il a un avenir proche, <em>techniquement</em> parlant.<br />La différence entre du PAP et un cluster, c&#039;est le controle des nodes et la qualité des transferts inter-nodes.<br />J&#039;me demande quelle est la taille des données de Google par exemple, mais sur un réseau PAP, il faut rajouter, en plus, de la duplication quasi-infini, pour être sur qu&#039;à chaque instant, l&#039;info soit accessible.</p><p>Dans un futur proche, je pense que ce genre de projet est voué à l&#039;echec, à moins de ne parser qu&#039;une partie du Web (et encore..): encore faut-il définir ce qui mérite d&#039;être indexé, et ce qui ne le mérite pas.</p><p>Hawé, ArkSeth, t&#039;as déjà post, merci.</p>]]></description>
			<author><![CDATA[dummy@example.com (Haleth)]]></author>
			<pubDate>Thu, 01 Nov 2012 16:45:15 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11356071#p11356071</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11354951#p11354951</link>
			<description><![CDATA[<p>@Haleth : on a déjà eu ton avis, merci.</p><p>@Mindiell : je pense que l&#039;index est lui-même distribué, mais que le truc doit être pensé correctement pour que la récupération ne soit pas trop lente. Après tout, on n&#039;y pense pas forcément non plus, mais Google, c&#039;est loin d&#039;être un seul serveur aussi : leur propre index est distribué sur plein de machines situées un peu partout dans le monde. C&#039;est une boîte noire, mais sur le fonctionnement général, ça ne doit pas être foncièrement différent.</p>]]></description>
			<author><![CDATA[dummy@example.com (Elzen)]]></author>
			<pubDate>Thu, 01 Nov 2012 15:30:07 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11354951#p11354951</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11349891#p11349891</link>
			<description><![CDATA[<p>Bof</p>]]></description>
			<author><![CDATA[dummy@example.com (Haleth)]]></author>
			<pubDate>Thu, 01 Nov 2012 09:29:30 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11349891#p11349891</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11349111#p11349111</link>
			<description><![CDATA[<p>Rassurez-moi : vous avez pas le temps de répondre ou c&#039;est trop complexe et je ferai mieux d&#039;ouvrir un autre post ? <img src="http://forum.ubuntu-fr.org/img/smilies/wink.png" width="15" height="15" alt="wink" /></p>]]></description>
			<author><![CDATA[dummy@example.com (Mindiell)]]></author>
			<pubDate>Thu, 01 Nov 2012 07:55:59 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11349111#p11349111</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11338251#p11338251</link>
			<description><![CDATA[<p>Autre question car le sujet me semble très intéressant :<br />Imaginons un réseau pair-à-pair doté de suffisamment de machines qui parcourent le web et indexent les pages correctement. Le réseau sert essentiellement à partager leurs ressources niveau recherche, c&#039;est le plus &quot;facile&quot;</p><p>Maintenant, lorsque je vais sur une page web de recherche et que je rentre des mots clefs de recherche (par ex. ubuntu 12.10, au hasard hein).<br />Je suppose que la liste des pages liées à ces mots-clefs est, elle aussi, stockée quelque part. Mais cela ne représente-t-il pas une trop grosse masse d&#039;informations ?</p><p>Google me signale qu&#039;il trouve &quot;Environ 8 320 000 résultats&quot;. Cela fait tout de même plus de 8 millions d&#039;urls potentielles à stocker en lien avec ces, disons deux, mots-clefs que sont &quot;ubuntu&quot; et &quot;12.10&quot;. En considérant qu&#039;une url fait environ 80 caractères de long en moyenne (je compte un peu large et j&#039;ai cherché très très rapidement hein). Ca fait, au bas mot, 640 millions d&#039;octets, donc environ 610 Mo juste pour fournir les urls. Alors, on est bien d&#039;accord qu&#039;on ne va pas fournir 610 Mo à chaque fois et qu&#039;on fournira peut-être une centaine d&#039;urls d&#039;un coup par exemple, avec un machin quelconque pour demander la suite de la liste.</p><p>Ma question est donc : comment stocker cette information des index ? Stocker des fichiers (et donc un gros volume) sur un réseau PàP (hi hi hi marrant de franciser le P2P) c&#039;est une bonne solution : la personne trouve rapidement un serveur qui va lui fournir un truc qu&#039;elle va récupérer lentement. Mais là, on attend à retrouver l&#039;info rapidement, non ?</p><p>Ayant donc pour &quot;ambition&quot; (c&#039;est un bien grand mot pour de la théorie spéculative pour le moment) de créer un moteur de recherche alternatif (disons plutôt réfléchir à une possible possibilité), je me pose la question <img src="http://forum.ubuntu-fr.org/img/smilies/smile.png" width="15" height="15" alt="smile" /></p><p>Critiques, commentaires, etc... sont attendus avec impatience !</p><p>EDIT :<br />Je viens d&#039;essayer YaCy sur leur &quot;portail de démo&quot;, c&#039;est abominable de lenteur : je ne peux pas taper une requête sans être stoppé par un immonde machin ajax qui cherche à deviner ce que je veux taper. Au final, je dois appuyer sur une touche et attendre 1-4 secondes qu&#039;il veuille bien me rendre la main pour un deuxième caractère. Enfin, la recherche est assez lente. C&#039;est peut-être l&#039;effet poratil de démo ou l&#039;effet P2P, mais ça donne pas envie d&#039;aller plus loin, c&#039;est dommage...</p>]]></description>
			<author><![CDATA[dummy@example.com (Mindiell)]]></author>
			<pubDate>Wed, 31 Oct 2012 11:01:40 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11338251#p11338251</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11331391#p11331391</link>
			<description><![CDATA[<div class="quotebox"><cite>seb24 a écrit&#160;:</cite><blockquote><div><div class="quotebox"><cite>Keiser a écrit&#160;:</cite><blockquote><div><p>Ne parle pas au passé tu vas nous foutre le bousin ! <img src="http://forum.ubuntu-fr.org/img/smilies/big_smile.png" width="15" height="15" alt="big_smile" /><br />Plus sérieusement, j&#039;espère que c&#039;est encore vivant seeks, ça me ferait vraiment mal que ce soit abandonné...</p></div></blockquote></div><p>Je viens demander sur leur IRC. Visiblement c&#039;est un peu mort en ce moment car les devs principaux sont occupe mais y&#039;a encore de l&#039;espoir et le projet n&#039;est pas abandonne pour autant. <img src="http://forum.ubuntu-fr.org/img/smilies/big_smile.png" width="15" height="15" alt="big_smile" /></p></div></blockquote></div><br /><p>Ah ça c&#039;est cool !<br />J&#039;espère qu&#039;ils iront au bout de leurs idées, il y a beaucoup d&#039;ambitions là dedans, et du besoin de mon côté <img src="http://forum.ubuntu-fr.org/img/smilies/smile.png" width="15" height="15" alt="smile" /></p>]]></description>
			<author><![CDATA[dummy@example.com (Keiser)]]></author>
			<pubDate>Tue, 30 Oct 2012 19:40:16 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11331391#p11331391</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327921#p11327921</link>
			<description><![CDATA[<p>Il a déjà été dit et redit que Seeks ne correpondait pas à la demande pour le moment <img src="http://forum.ubuntu-fr.org/img/smilies/wink.png" width="15" height="15" alt="wink" /><br />Je vais jeter un oeil au Canard...</p><p>VU : Il semble qu&#039;il s&#039;ppuie tout de même sur d&#039;autres moteurs. Les gens parlent d&#039;un moteur hybride...</p>]]></description>
			<author><![CDATA[dummy@example.com (Mindiell)]]></author>
			<pubDate>Tue, 30 Oct 2012 15:02:34 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327921#p11327921</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327901#p11327901</link>
			<description><![CDATA[<div class="quotebox"><cite>Keiser a écrit&#160;:</cite><blockquote><div><p>Ne parle pas au passé tu vas nous foutre le bousin ! <img src="http://forum.ubuntu-fr.org/img/smilies/big_smile.png" width="15" height="15" alt="big_smile" /><br />Plus sérieusement, j&#039;espère que c&#039;est encore vivant seeks, ça me ferait vraiment mal que ce soit abandonné...</p></div></blockquote></div><p>Je viens demander sur leur IRC. Visiblement c&#039;est un peu mort en ce moment car les devs principaux sont occupe mais y&#039;a encore de l&#039;espoir et le projet n&#039;est pas abandonne pour autant. <img src="http://forum.ubuntu-fr.org/img/smilies/big_smile.png" width="15" height="15" alt="big_smile" /></p>]]></description>
			<author><![CDATA[dummy@example.com (seb24)]]></author>
			<pubDate>Tue, 30 Oct 2012 15:01:04 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327901#p11327901</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327811#p11327811</link>
			<description><![CDATA[<p>Ne parle pas au passé tu vas nous foutre le bousin ! <img src="http://forum.ubuntu-fr.org/img/smilies/big_smile.png" width="15" height="15" alt="big_smile" /><br />Plus sérieusement, j&#039;espère que c&#039;est encore vivant seeks, ça me ferait vraiment mal que ce soit abandonné...</p>]]></description>
			<author><![CDATA[dummy@example.com (Keiser)]]></author>
			<pubDate>Tue, 30 Oct 2012 14:55:49 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327811#p11327811</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327611#p11327611</link>
			<description><![CDATA[<p>Y&#039;avait ca : <a href="http://www.seeks-project.info/site/">http://www.seeks-project.info/site/</a><br />Mais y&#039;a plus trop de mises a jours.</p>]]></description>
			<author><![CDATA[dummy@example.com (seb24)]]></author>
			<pubDate>Tue, 30 Oct 2012 14:31:05 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327611#p11327611</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327401#p11327401</link>
			<description><![CDATA[<p>Je maintient que duck duck go a sa propre base de donné (qui peut être complété par d&#039;autre moteur mais alors ce n&#039;est pas un méta moteur puisque ça base de donné est COMPLÉTÉ par d&#039;autres)<br />source GN/Linux essentiel n°28</p>]]></description>
			<author><![CDATA[dummy@example.com (gnales)]]></author>
			<pubDate>Tue, 30 Oct 2012 14:14:33 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327401#p11327401</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327301#p11327301</link>
			<description><![CDATA[<p>Bah, en théorie, un moteur de recherche pair-à-pair pas trop mal foutu peut tourner aussi efficacement que n&#039;importe quel réseau pair-à-pair… BitTorrent n&#039;a pas trop de soucis à ce niveau, par exemple, &#039;me semble. Tout ce qu&#039;il faut, c&#039;est un nombre suffisant d&#039;utilisateurs pour faire tourner le truc…</p>]]></description>
			<author><![CDATA[dummy@example.com (Elzen)]]></author>
			<pubDate>Tue, 30 Oct 2012 14:07:59 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11327301#p11327301</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  Alternative libre au moteur de recherche Google ?]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11326211#p11326211</link>
			<description><![CDATA[<p>J&#039;ai une petite question : si un tel projet vraiment libre existait. Comment pourrait-il vivre ? Économiquement je veux dire, parce que même Google en son temps avait failli faire faillite...<br />Pensez-vous qu&#039;un réseau de machines d&#039;utilisateurs lambdas pourrait faire vivre un tel projet ? Je parle aussi en terme de publicité (qui dit libre, dit sans récupération de données personnelles)</p>]]></description>
			<author><![CDATA[dummy@example.com (Mindiell)]]></author>
			<pubDate>Tue, 30 Oct 2012 12:38:08 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11326211#p11326211</guid>
		</item>
	</channel>
</rss>
