this post was submitted on 10 Jul 2023
20 points (95.5% liked)
France
2800 readers
2 users here now
Hop, [email protected] c'est finit, merci de migrer sur [email protected]
founded 1 year ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
D'accord, mais pourquoi est-ce que les robots iraient récupérer nos données sur le serveur, alors qu'ils peuvent simplement parcourir le site Lemmy et tout copier?
Justement c'est surement parce que je connais pas l'aspect technique et donc si tu as des ressources à me recommander, je veux bien. Dans ma tete, le robot et l'utilisateur n'utilisent pas les meme canaux pour recuperer et lire le contenu. Ca vient du fait que si j'utilise sftp pour recuperer les données de mon nuage et bien sans mes ID, c'est impossible de les lire. Si j'utilise un client et que je me connecte avec mes ID, alors je peux les lire.
Et donc j'imaginais un truc comme ça.
En fait la différence principale c'est qu'ici, les messages sont accessibles via le site, en HTTP, par tout le monde, là où ton serveur SFTP ne l'est pas.
Si quelqu'un demain décide de récupérer tous mes commentaires sur Lemmy, il n'a qu'à aller sur mon profil et copier les messages.
Je ne sais pas si c'est plus clair ?
Oui effectivement c'est plus clair. Je vais réviser un peu les protocoles du coup et trouver de quoi comprendre comment le web scrapping marche.