this post was submitted on 19 Jun 2023
12 points (100.0% liked)

de_EDV

3805 readers
1 users here now

Ableger von r/de_EDV auf Lemmy.

News, Diskussionen und Hilfestellung zu Hard- und Software

Diese Community dient als Anlaufstelle für alle IT-Interessierten, egal ob Profi oder blutiger Anfänger. Stellt eure Fragen und tauscht euch aus!

Weitere IT Communitys:

[email protected]

[email protected]

[email protected]

[email protected]

founded 1 year ago
MODERATORS
 

Hallo zusammen, langsam nervt es mich, dass die meisten News-Artikel, die man über irgendeine Suchmaschine aufruft, hinter einer Paywall sind und man das erst mitbekommt, wenn man das Suchergebnis aufgerufen hat. Ich möchte die Paywalls garnicht umgehen, sondern einfach nur vor dem anklicken sehen, ob der Artikel ne Paywall hat oder nicht.

Gibt es da irgendwelche Suchmaschinen, die sowas flaggen bzw. die Paywall-Ergebnisse komplett exkludieren? Oder vielleicht Browser-Plugins die sowas können?

Vielen Dank schonmal :)

top 6 comments
sorted by: hot top controversial new old
[–] [email protected] 6 points 1 year ago (1 children)

Es gibt/gab archive.is (und denke auch archive.ph) wenn es mal funktioniert, klappt gerade bei vielen deutschsprachigen Seiten gut bei denen ich mit 12ft.io bisher nicht weiterkam.

(Aktuell liefert cloudflare nur nen DNS fehler, ist das ewige Katz- und Maus-Spiel)

[–] [email protected] 1 points 1 year ago (1 children)

Ja tatsächlich, bei 12ft.io war ich in letzter Zeit auch meist erfolglos. Wie funktioniert das eigentlich mich archive.is? Sind die meisten Artikel erstmal nicht hinter einer Paywall und werden dann auf Paywall geschalten? Weil eigentlich speichert archive ja nur nen Snapshot von der Website oder?

Und genau wegen diesem Katz- und Maus-Spiel dachte ich halt, dass es ja wesentlich einfacher sein müsste die Websites mit Paywall in den Suchergebnissen zu flaggen, statt die Paywall tatsächlich zu umgehen. Die Suchmaschine müsste ja nur auf so Keywords wie "Abo, PLUS, ..." (vielleicht noch in Kombination mit der Text-länge?) achten und dann irgendeine Markierung neben den Link setzen. Also so stell ich mir das zumindest vor :D

[–] [email protected] 2 points 1 year ago (1 children)

archive.fo scheint gerade zu funktionieren, im Wikipedia Artikel gibt es noch mehr mirrors, auch eben erst gelernt.

Nachdem das ganze per Demand funktioniert bin ich mir selbst nicht sicher ob Artikel kurzzeitig den paywall status wechseln (zumindest beim Spiegel scheint das ab und zu vorzukommen in beide Richtungen) oder ob es reicht wenn jemand mit aktivem Abo auf das Knöpfchen drückt.

Was deine Ursprungsfrage zu den Suchergebnissen: Es gibt ja meist den Anleser "umsonst" d.h. mehr wird i.d.R. auch nicht indiziert werden vermute ich. Für den description block in der Ergebnisliste reicht das aus, deswegen hat da wohl kein Anbieter die Motivation nochmal nen check auf eine Paywall einzubauen.

[–] [email protected] 1 points 1 year ago

Ok, dann werd ich mir da vlt. mal ne Link-Weiterleitung einrichten, danke!

Hatte grade noch die Idee, dass man ja sowas ähnliches wie Sponsorblock für Youtube auch für die Suchergebnisse und Paywalls machen könnte:

Durch Crowdsourcing die Links von Artikeln sammeln, die hinter einer Paywall stecken und diese dann in den gängigen Suchmaschinen markieren. Aber umsetzen kann ich das nicht und für Crowdsourcing braucht man natürlich auch erstmal ne Crowd :D

[–] [email protected] 1 points 1 year ago

Es gibt 12ft.io, damit kommt man an vielen paywalls vorbei.

Abgesehen davon führe ich auch nur eine geistige Liste und würde mich über Vorschläge zu besseren Lösungen freuen.

[–] [email protected] 1 points 1 year ago

Das wird zukünftig noch viel schwerer sein, da paywalls bald dynamisch ausgespielt werden, basierend auf das Nutzerverhalten + KI.

Eine korrekte Auszeichnung wird also schwer bis unmöglich. Google könnte per se bei Treffern von bestimmten Seiten einen Marker setzen der besagt, dass Inhalte dieser Quelle womöglich hinter einer paywall stehen.