Google se nourrit de l’indexation de son moteur de recherche avec les données du site recueillies à partir d’une armée virtuelle de “bots”, nommés GoogleBot, donc utilisés par le moteur de recherche Google afin de recenser et indexer les pages Web, qui écument ainsi chaque jour des milliards de pages Web. Mais, par le passé les robots d’indexation de Google se heurtaient à un mur dès qu’ils devaient parcourir du contenu interactif qui étaient chargé en JavaScript, surtout dès lors que les pages usaient et abusaient de la technologie AJAX, Asynchronous JavaScript and XML, et ce dans le but de permettre aux utilisateurs d’accéder à du contenu supplémentaire sans avoir à recharger les pages.

Mais, maintenant si l’on en croit le développeur Alex Pankratov, il semble que les robots de Google soient capables d’agir plus comme des êtres humains à tel point qu’ils pourraient d’exploiter le contenu interactif d’un site Web, exécutant ainsi le JavaScript sur les pages lors de l’indexation permettant ainsi de voir ce qui se cache derrière les différentes pages !

Google a par le passé offert des propositions visant à rendre le contenu AJAX plus consultable, mais ce travail était à la charge des développeurs plutôt que les GoogleBots, mais celles-ci n’ont pas convaincus autant que Google l’avait espéré.
Au cours du dernier trimestre 2011, Google a finalement commencé à comprendre comment résoudre efficacement le problème, et a commencé à déployer les robots d’indexation qui pourrait explorer le contenu dynamique des pages en mode limité. En effet, cette version permettait simplement de récupérer à travers le code JavaScript d’une page, de trouver les URL et les ajouter à l’analyse.
Il a fallu que Google puisse permettre, dans certains cas, à ses robots d’envoyer des requêtes dîtes POST vers des sites Web, selon comment le code JavaScript était écrit, plutôt que de simplement effectuer une requête traditionnelle GET pour en extraire le contenu.
Par conséquent, par exemple Google a pu commencer à l’indexation des commentaires sur Facebook, ainsi que d’autres des systèmes de commentaires “dynamiques”.

Googlebot keeps getting smarter. Now has the ability to execute AJAX/JS to index some dynamic comments goo.gl/F9et1

— Matt Cutts (@mattcutts) Novembre 1, 2011

Maintenant, sur la base des logs de Pankratov, il semble que plutôt que de simplement exploiter de façon mineure les URL dans les scripts, les robots se promènent encore plus profondément que les commentaires, en traitement des fonctions JavaScript de telle manière qu’ils imitent l’action utilisateur lorsqu’il clique sur les objets qu’ils activent.

Cette nouvelle va fournir à Google d’avoir un meilleur accès au “Web profond”, en permettant ainsi d’accéder à du contenu caché dans des bases de données, ou encore d’autres sources qui ne sont généralement pas indexables.

Que pensez-vous de cette nouvelle ? Y voyez-vous comme quelque-chose de dangereux pour le Web ?

Meta : Vos photos Instagram servent à entraîner leur IA (et vous ne pouvez rien y faire ?)

Bluesky lance sa vérification : le badge bleu est de retour !

Bluesky redéfinit la vérification : Qui aura le droit à la coche bleue ?

Le Pape François est décédé à l’âge de 88 ans

Test des Huawei FreeArc : des écouteurs ouverts à prix cassé pour les sportifs

Test des Huawei FreeBuds Pro 4 : Son haute-fidélité à un prix abordable !

Test des Xiaomi OpenWear Stereo : Une alternative aux écouteurs intra-auriculaires ?

Test du Microsoft Surface Laptop 7 : Une surprenante renaissance avec le Snapdragon X Elite

Galaxy Z Fold 7/Galaxy Z Flip 7 : Samsung accélère le pliable !

iPhone 17 : Pénurie, prix en hausse ? Le chaos Apple

Vivo Pad SE & Vivo 5 Pro : 2 nouvelles tablettes pour tous les besoins !

CMF Phone 2 Pro : design 2 tons, puissance en hausse ? Le nouveau Nothing abordable !

Xiaomi Smart Camera 4 : La 4K intelligente à prix cassé (moins de 35 €)

Hallucinations : OpenAI reconnaît un problème avec o3 et o4-mini

OpenAI contre-attaque : Elon Musk accusé de harcèlement et de désinformation !

Marché PC : Reprise en 2025, mais les tarifs douaniers menacent la croissance

Cursor : Une erreur d’IA provoque une fuite massive d’utilisateurs

Firebase Studio : Google dévoile l’outil IA qui va révolutionner le développement d’applications !

Créez sans coder : Le Vibe Coding pour tous avec l’IA

Qu’est-ce que le Vibe Coding et pourquoi il est risqué ?

Transformez votre MacBook en un ordinateur de bureau puissant avec une station d’accueil

L’IA au secours des API : Le guide pour les utiliser facilement, même sans coder !

Débuter sur GitHub : Le guide simple pour les développeurs

Migrer de Google à Proton : e-mails, mots de passe, fichiers, le guide étape par étape

Google peut maintenant indexer le contenu interactif d’une page Web

Casual Games Cup : Un concours national de création de jeux Web !

Suivre l’ouverture du NASDAQ en direct avec l’arrivée des actions Facebook !

The author Yohann Poiron

Google peut maintenant indexer le contenu interactif d’une page Web

The author Yohann Poiron

vous pourriez aussi aimer