AmazonBot – Que fait Bezos ?

Encore un autre bot d'entreprise merdique qui aspire des données et probablement pour un autre LLM

Chaque fois que cela se produit, je m’énerve déraisonnablement, une entreprise qui décide que les choses sur Internet lui appartiennent pour les repackager et revendre, c’est le même genre de tech bros qui pensent que le consentement est donné parce que vous étiez trop ivre pour dire non lors d’une fête.

Yet another shitty corporate bot sucking up data and probably for another LLM

Je n’ai pas de problème avec les robots d’indexation tant que leurs intentions sont bonnes, l’internet est fait pour partager, je veux partager mes choses avec le monde et si votre robot vient indexer mon site dans les résultats de recherche, c’est cool. J’autorise de nombreux robots à venir aussi souvent qu’ils le souhaitent, et j’encourage même des projets comme l’Internet Archive à prendre ce qu’ils veulent.

    # Allow the internet archiver to access my whole site
    User-agent: ia_archiver
    Allow: /
    User-agent: archive.org_bot
    Allow: /

Le fait d’avoir un domaine .fr dit déjà oui, je veux que la BnF en prenne une copie et la conserve, même la merde de 2001.

Ce que je conteste absolument, c’est que des connards comme Sam Altmann crient qu’ils devraient pouvoir baiser tout le monde parce que leur activité de fabrication de machines à plagier ne fonctionne pas si les gens ne veulent pas que leur travail soit plagié.

PISS

En 2022, j’ai découvert que Salesforce avait un bot qui s’est déchaîné sur l’un de mes sites et a commencé à essayer de s’introduire dans la section des commentaires. Il a fallu des mois pour obtenir une réponse de leur part, mais j’ai dû les menacer sur deux fronts – le droit d’auteur et le RGPD. Le travail que cela représente est irréel et la plupart du temps, ils reculent car ma politique en matière de droits d’auteur est très claire : Attribution, Non Commercial, Partage des Conditions Initiales à l’Identique. Le GDPR est également très clair s’ils collectent des informations pour établir des profils sans consentement, ce qui est exactement ce que fait Salesforce.

Mais encore une fois, cela me prend du temps et je ne devrais pas avoir à le faire, je ne devrais pas avoir à découvrir quels sont les bots de merde qui sont créés chaque jour. Nos gouvernements de merde qui sont bien trop occupés à essayer de casser le cryptage devraient mettre en place un cadre juridique pour limiter ce que les entreprises peuvent prendre, permettre des utilisations légitimes comme la recherche, tout en forçant une solution opt-in pour tout ce qui n’est pas un simple index de recherche. Il y a de bien meilleures personnes sur cette planète qui pourraient peser le pour et le contre de ce genre de choses et rédiger une proposition qui respecte l’ouverture de l’internet, tout en restreignant les machines à voler capitalistes.

Mais que fait BezosBot ? Il veut probablement que nous allions tous pisser dans des bouteilles, mais il affirme qu’ Amazonbot est le robot d’exploration d’Amazon utilisé pour améliorer nos services, par exemple pour permettre à Alexa de répondre à encore plus de questions pour les clients.

I don’t even know what that means

Nous pouvons supposer que le fait de consulter mon blog à 3h du mat et d’aspirer toutes mes archives LiveJournal n’a absolument rien à voir avec des conseils d’achat et serait une indication que le monstre mondial des données essaie probablement de faire monter la ligne avec sa propre interprétation d’un LLM.

Bref, cela signifie que je dois envoyer un autre courriel sévère pour les obliger à supprimer tout ce qu’ils viennent de capturer et à ne plus jamais recommencer.

Ugh