La carte mondiale de l'Internet ...

marrant ce truc, j'aurai pense google et youtube bien plus gros que FB qd meme, ca inclut les sites pornos?
 
Carte mondiale de l'internet "reference"... :)

Pour votre information, la majeure partie de l'internet reste inconnu par la pluspart des internautes.
cf. deep web, hidden web...
 
Carte mondiale de l'internet "reference"... :)

Pour votre information, la majeure partie de l'internet reste inconnu par la pluspart des internautes.
cf. deep web, hidden web...

C'est vrai mais cette "carte" s'attache surtout à souligner les volumes de transit et pas la taille des sites, elle reste donc relativement valable. Les volumes phénoménaux de données du deep web n'étant que trés peu consultés, en comparaison des données référencées.
 
Carte mondiale de l'internet "reference"... :)

Pour votre information, la majeure partie de l'internet reste inconnu par la pluspart des internautes.
cf. deep web, hidden web...

Comment savoir la taille du deep web? ca me semble bien difficile, mais je n'y connais rien
 
Comment savoir la taille du deep web? ca me semble bien difficile, mais je n'y connais rien

Il n'est pas mesure mais estime, exemple pris sur wiki, (a actualise mais je n'ai pas access a tous les sites actuellement):

"Une étude de juillet 2001 réalisée par l'entreprise BrightPlanet estime que le web profond pouvait contenir 500 fois plus de ressources que le web indexé par les moteurs de recherche. ...Le web surfacique (facilement accessible via des moteurs de recherches, par exemple) a une taille d'environ 167 téraoctets. D'après des études faites à l'Université de Berkeley, la taille du web profond est estimée à environ 91 000 téraoctets.
En 2008, le web dit "invisible" non référencé par les moteurs de recherche représente 70 à 75% de l'ensemble, soit environ un trilliard de pages non indexées"
 
Dernière édition:
C'est vrai mais cette "carte" s'attache surtout à souligner les volumes de transit et pas la taille des sites, elle reste donc relativement valable. Les volumes phénoménaux de données du deep web n'étant que trés peu consultés, en comparaison des données référencées.

Certes, je n'ai pas pu ouvrir le lien car bloque sur mon lieu de travail, je me suis fie au titre :)
Forcement, le deep web est peu consulte puisque non indexe et relativement inconnu de l'internautes lambda.
Je souhaitais juste faire part de cette facette du net (pas forcement des plus belles :)) a ceux qui n'en auraient pas connaissance :)
 
Il n'est pas mesure mais estime, exemple pris sur wiki, a verifier:

"Une étude de juillet 2001 réalisée par l'entreprise BrightPlanet estime que le web profond pouvait contenir 500 fois plus de ressources que le web indexé par les moteurs de recherche. ...Le web surfacique (facilement accessible via des moteurs de recherches, par exemple) a une taille d'environ 167 téraoctets. D'après des études faites à l'Université de Berkeley, la taille du web profond est estimée à environ 91 000 téraoctets.
En 2008, le web dit "invisible" non référencé par les moteurs de recherche représente 70 à 75% de l'ensemble, soit environ un trilliard de pages non indexées"

Ok, quand on voit la definition, c'est assez normale, des gros sites connus rentrent dedans si certaines de leurs pages sont proteges ou si il y a besoin de java ou flash...
 
Ok, quand on voit la definition, c'est assez normale, des gros sites connus rentrent dedans si certaines de leurs pages sont proteges ou si il y a besoin de java ou flash...

Oui, mais ce qui est suprenant ce n'est pas forcement sa taille, mais ce qu'on peut y trouver/faire.
Ce dont ca attisera la curiosite trouverons pleins de renseignements sur Google. Revenons au sujet du topic je ferme le HS :)
 
Oui, mais ce qui est suprenant ce n'est pas forcement sa taille, mais ce qu'on peut y trouver/faire.
Ce dont ca attisera la curiosite trouverons pleins de renseignements sur Google. Revenons au sujet du topic je ferme le HS :)

Ok, en tout cas merci pour l'info de cette facette du net!
 
Je souhaitais juste faire part de cette facette du net (pas forcement des plus belles :)) a ceux qui n'en auraient pas connaissance :)

Est ce que ces 75% de pages "cachees" inclus aussi les pages persos facebook ou autres pages de websites auxquelles tu n'as pas acces si tu n'es pas logge?
 
Est ce que ces 75% de pages "cachees" inclus aussi les pages persos facebook ou autres pages de websites auxquelles tu n'as pas acces si tu n'es pas logge?

On peut classer les ressources du web profond dans une ou plusieurs des catégories suivantes :

  • contenu dynamique : pages dynamiques dont le contenu est généré en réponse aux données entrées dans un formulaire.
  • contenu non lié : pages qui ne sont pas liées par d'autres pages et qui ne peuvent donc pas être découvertes par les robots d'indexation. Ce contenu est connu comme des pages sans backlinks (ou inlinks).
  • contenu à accès limité : pages de sites qui exigent un enregistrement ou imposent un accès limité à leurs pages (par exemple utilisant le Lien retiré), ce qui empêche les moteurs de recherche de les explorer et de créer des copies en Lien retiré.
  • contenu de script : pages qui ne sont accessibles qu'à travers des liens produits par l'exécution de programmes, par exemple en JavaScript, Lien retiré ou en Flash.
  • contenu non indexable : documents dans des Lien retiré non supportés par les robots d'indexation.
source wiki
 
En panne d amis?

UTILISEZ FESSE-BOUC!
Je sors:dsl:
 
Dernière édition par un modérateur: