Sind Sie ein Mensch? Oder was es mit diesen Captcha-Bildern auf sich hat

Inhalt

1 Goolge weiß am Besten, wer ein Robot ist
2 Googles Wissen aus der Werbung, um Betrug zu vermeiden
3 Das Captcha — eine weitere Anwendung derselben Technologie
4 Bilder in Captchas
5 Warum ist es überhaupt wichtig, nach Robotern zu checken?
6 Ein Caveat: Katz und Maus
7 Hier zum Weiterlesen ein paar spaßige Captchas aus dem Netz:
8

Goolge weiß am Besten, wer ein Robot ist

Wenn Sie eine Abfrage auf einer Seite durchführen, dann stoßen Sie oft auf diese Frage: “Sind Sie ein Mensch?”

Das typische Abfrage-Formular, das Sie dann finden, die ist von Google. Das ist das, auf dem ein animierter Haken erscheint, wenn Sie wirklich ein Mensch sind. Wenn Google Zweifel hat, dann kommen Sie zu diesem Rasterbild, auf dem Sie etwas auswählen sollen: Markieren Sie alle Glockentürme im Bild, alle Zebrastreifen oder alle Autobusse 😉

Da ein Robot den Inhalt der Frage nicht verstehen kann, kann man so unterscheiden, ob der Anfragesteller ein Mensch ist oder nicht.

Im Hintergrund laufen allerdings noch viele andere Prozesse ab, z.B. wird geschaut, ob die IP-Adresse zum Anfrager passt, aus welchem Land die Anfrage kommt, wie oft Anfragen gestartet wurden etc.

Googles Wissen aus der Werbung, um Betrug zu vermeiden

Google testet bei jedem Ad-Klick auf eine Google-Anzeige automatisch, ob die Besucher Roboter sind. Google macht das, um Betrug vorzubeugen. Denn es könnten ja auch konkurrierende Firmen sein, die einen Robots einfach 1.000x klicken lassen, sodass der Wettbewerber jedes Mal Geld für den Klick zahlen muss. So würde Googles Geschäftssystem natürlich zusammenbrechen.

Deshalb hat Google ausgesprochen ausgefeilte Algorithmen entwickelt, die verhindern sollen, dass Robots klicken. Nur Menschen sollen die Werbung benutzen und auf die dahinter gelegene Seite kommen.

Das Captcha — eine weitere Anwendung derselben Technologie

Dass diese Technologie auch auf Webseiten funktioniert, ist klar — schließlich ist die Google-Suche auch nur eine Webseite. Google kann mit dem gleichen System also auch testen, ob die Webseite wirklich von einem Menschen frequentiert wird.

Bilder in Captchas

Ihr alle kennt diese unglaublichen Bilder, in der wir nach graduellen Unterscheidungen gefragt werden. Diese Bilder tauchen inzwischen nur noch auf, wenn Google keine andere Möglichkeit gefunden hat, Rückschlüsse darauf zu ziehen, ob die Anfrage von einem Bot oder einen Menschen kam.

Warum ist es überhaupt wichtig, nach Robotern zu checken?

Wenn wir uns ein paar Fälle anschauen, wird es schnell verständlich, warum wir eine Überwachung vor Spam brauchen:

Spam-Kommentare: vor einigen Jahren hatte ich eine Webseite zum Spanisch-Lernen. Ich hatte ca. 70 Artikel mit diversen Hilfen online. Die Seite lief so vor sich hin und irgendwann schaute ich mal wieder auf die Seite und stellte fest: ich hatte über 23.000 automatisch generierte Spam-Einträge. Da es sich nicht um ein einfaches Blog handelte, sondern um ein Wiki, konnte ich die Einträge nicht gesamt löschen, sondern nur jeweils 100 Stück auswählen und dann löschen. In letzter Konsequenz war das zu viel Arbeit für ein Hobby-Projekt, das ich dann einstampfte.
Abgreifen von Daten: einige Webseiten bieten Tools kostenlos an, aber nur für “normale” Nutzung, d.h. ein paar Abfragen pro Tag wie z.B. das Tool Keyworddichte.com. Nun gibt es aber Leute, die wollen diesen Service massenhaft nutzen. Der Anbieter der Webseite mag das aus verschiedenen Gründen nicht, er will das Tool selber vermarkten oder er will eine Anmeldung bei seinem Service erzwingen, damit er Emailadressen generiert.
Automatisches Abgreifen von Daten: nun programmieren Findige Entrepreneure auch Bots, die die Daten eines solchen Tools auslesen wollen. Das generiert eine Unmenge an Abfragen und der Webseitenbesitzer muss für den Traffic zahlen, das will er natürlich nicht.
Erschleichen von Dienstleistungen: kopieren das Tool einfach und stellen den Service auf der eigenen Webseite als eigenen Dienst zur Verfügung, ohne natürlich den Programmierer des Tools dafür zu bezahlen. Auch das geht automatisch über Bots, die der originale Toolanbieter natürlich draußen halten will.

Dies sind m.E. die häufigsten Fälle, warum Anbieter ein Captcha auf ihre Seite platzieren.

Ein Caveat: Katz und Maus

Als Caveat muss man natürlich sagen: das ist ein Rennen, die Betrüger entwickeln etwas Neues, Google schließt die Lücke und dann kommt wieder etwas Neues vonseiten der Betrüger!

Grundsätzlich hat Google aber allerhand Ressourcen, um schnell reagieren zu können, sodass sich für euch der Einbau eines Google-Captchas durchaus lohnen kann. Allerdings ist es wie bei allen Dingen von Google: man weiß nicht, wie viele Daten an Google abfließen, denn die Dienste von Google sind ja nie kostenlos, ihr zahlt immer mit Daten.

Viel Erfolg beim Kampf gegen den Spam und die Betrüger,
Euer Dietmar

Hier zum Weiterlesen ein paar spaßige Captchas aus dem Netz:

Wie hilfreich war dieser Beitrag?

Klicke auf die Sterne um zu bewerten!

3 Kommentare

Antje Schroeder 14. April 2020

Endlich mal ein Artikel über diese nervigen Ampelsuchbilder. Aber warum sind die Ampeln etc oft so schwer zu erkennen, so dass oft mehrere Versuche nötig sind-gehört das zum Programm, weil man anders nicht Menschen von Robotern unterscheiden kann?

Antworten
1. charles 14. April 2020
  
  Hallo Antje,
  eine gute Frage! Da gibt es zwei Erklärungen, die ich allerdings in meiner Recherche nicht voll bestätigt gefunden habe. Die eine hast du ja schon angesprochen: je besser die Sachen zu erkennen sind, desto besser schaffen das die Bots. Ich habe ein Huawei-Telefon und es ist unglaublich, wie gut die künstliche Intelligenz da drin bestimmen kann, was auf einem Foto zu sehen ist.
  Das andere ist die Idee: Google nimmt die Bilder aus der Bildersuche und alles, was da zu sehen ist zu einem Begriff gehört dazu, alles andere nicht.
  Und wenn wir schon dabei sind, hätten wir noch eine dritte Variante, trifft auf den Fußgängerüberweg in diesem Artikel zu: die KI versagt einfach, indem sie etwas definiert, das so nicht nachvollzogen kann. Liegt dann daran, dass sie nicht richtig trainiert ist.
  
  Aber wie gesagt: ich habe keine Erklärungen von Google gefunden, nur Meinungen von anderen dazu in Foren wie Stack Overflow, also das sind dann schon Fachleute, aber eben nicht von Google 😉
  Liebe Grüße,
  Dietmar
  
  Antworten
Warum heißen alle Spammer Eric? - New Rules of Marketing 17. August 2020

[…] Captcha für euer Kontaktformular: habe ich ja neulich mal drüber geschrieben, konkret heißt das: wenn ihr zu viele Spam-Kommentare über euer Kontaktformular […]

Antworten