Sind Sie ein Mensch? Oder was es mit diesen Captcha-Bildern auf sich hat

Goolge weiß am Besten, wer ein Robot ist

Ver­wirrende Captcha-Abfra­gen

Wenn Sie eine Abfrage auf ein­er Seite durch­führen, dann stoßen Sie oft auf diese Frage: “Sind Sie ein Men­sch?”

Das typ­is­che Abfrage-For­mu­lar, das Sie dann find­en, die ist von Google. Das ist das, auf dem ein ani­miert­er Hak­en erscheint, wenn Sie wirk­lich ein Men­sch sind. Wenn Google Zweifel hat, dann kom­men Sie zu diesem Raster­bild, auf dem Sie etwas auswählen sollen: Markieren Sie alle Glock­en­türme im Bild, alle Zebras­treifen oder alle Auto­busse 😉

Da ein Robot den Inhalt der Frage nicht ver­ste­hen kann, kann man so unter­schei­den, ob der Anfragesteller ein Men­sch ist oder nicht.

Im Hin­ter­grund laufen allerd­ings noch viele andere Prozesse ab, z.B. wird geschaut, ob die IP-Adresse zum Anfrager passt, aus welchem Land die Anfrage kommt, wie oft Anfra­gen ges­tartet wur­den etc.

Googles Wissen aus der Werbung, um Betrug zu vermeiden

Google testet bei jedem Ad-Klick auf eine Google-Anzeige automa­tisch, ob die Besuch­er Robot­er sind. Google macht das, um Betrug vorzubeu­gen. Denn es kön­nten ja auch konkur­ri­erende Fir­men sein, die einen Robots ein­fach 1.000x klick­en lassen, sodass der Wet­tbe­wer­ber jedes Mal Geld für den Klick zahlen muss. So würde Googles Geschäftssys­tem natür­lich zusam­men­brechen.

Deshalb hat Google aus­ge­sprochen aus­ge­feilte Algo­rith­men entwick­elt, die ver­hin­dern sollen, dass Robots klick­en. Nur Men­schen sollen die Wer­bung benutzen und auf die dahin­ter gele­gene Seite kom­men.

Das Captcha — eine weitere Anwendung derselben Technologie

Dass diese Tech­nolo­gie auch auf Web­seit­en funk­tion­iert, ist klar — schließlich ist die Google-Suche auch nur eine Web­seite. Google kann mit dem gle­ichen Sys­tem also auch testen, ob die Web­seite wirk­lich von einem Men­schen fre­quen­tiert wird.

Bilder in Captchas

Ihr alle ken­nt diese unglaublichen Bilder, in der wir nach gradu­ellen Unter­schei­dun­gen gefragt wer­den. Diese Bilder tauchen inzwis­chen nur noch auf, wenn Google keine andere Möglichkeit gefun­den hat, Rückschlüsse darauf zu ziehen, ob die Anfrage von einem Bot oder einen Men­schen kam.

Warum ist es überhaupt wichtig, nach Robotern zu checken?

Wenn wir uns ein paar Fälle anschauen, wird es schnell ver­ständlich, warum wir eine Überwachung vor Spam brauchen:

  • Spam-Kom­mentare: vor eini­gen Jahren hat­te ich eine Web­seite zum Spanisch-Ler­nen. Ich hat­te ca. 70 Artikel mit diversen Hil­fen online. Die Seite lief so vor sich hin und irgend­wann schaute ich mal wieder auf die Seite und stellte fest: ich hat­te über 23.000 automa­tisch gener­ierte Spam-Ein­träge. Da es sich nicht um ein ein­fach­es Blog han­delte, son­dern um ein Wiki, kon­nte ich die Ein­träge nicht gesamt löschen, son­dern nur jew­eils 100 Stück auswählen und dann löschen. In let­zter Kon­se­quenz war das zu viel Arbeit für ein Hob­by-Pro­jekt, das ich dann ein­stampfte.
  • Abgreifen von Dat­en: einige Web­seit­en bieten Tools kosten­los an, aber nur für “nor­male” Nutzung, d.h. ein paar Abfra­gen pro Tag wie z.B. das Tool Keyworddichte.com. Nun gibt es aber Leute, die wollen diesen Ser­vice massen­haft nutzen. Der Anbi­eter der Web­seite mag das aus ver­schiede­nen Grün­den nicht, er will das Tool sel­ber ver­mark­ten oder er will eine Anmel­dung bei seinem Ser­vice erzwin­gen, damit er Emailadressen gener­iert.
  • Automa­tis­ches Abgreifen von Dat­en: nun pro­gram­mieren Find­i­ge Entre­pre­neure auch Bots, die die Dat­en eines solchen Tools ausle­sen wollen. Das gener­iert eine Unmenge an Abfra­gen und der Web­seit­enbe­sitzer muss für den Traf­fic zahlen, das will er natür­lich nicht.
  • Erschle­ichen von Dien­stleis­tun­gen: kopieren das Tool ein­fach und stellen den Ser­vice auf der eige­nen Web­seite als eige­nen Dienst zur Ver­fü­gung, ohne natür­lich den Pro­gram­mier­er des Tools dafür zu bezahlen. Auch das geht automa­tisch über Bots, die der orig­i­nale Toolan­bi­eter natür­lich draußen hal­ten will.

Dies sind m.E. die häu­fig­sten Fälle, warum Anbi­eter ein Captcha auf ihre Seite platzieren.

Ein Caveat: Katz und Maus

Als Caveat muss man natür­lich sagen: das ist ein Ren­nen, die Betrüger entwick­eln etwas Neues, Google schließt die Lücke und dann kommt wieder etwas Neues von­seit­en der Betrüger!

Grund­sät­zlich hat Google aber aller­hand Ressourcen, um schnell reagieren zu kön­nen, sodass sich für euch der Ein­bau eines Google-Captchas dur­chaus lohnen kann. Allerd­ings ist es wie bei allen Din­gen von Google: man weiß nicht, wie viele Dat­en an Google abfließen, denn die Dien­ste von Google sind ja nie kosten­los, ihr zahlt immer mit Dat­en.

Viel Erfolg beim Kampf gegen den Spam und die Betrüger,
Euer Diet­mar

Hier zum Weiterlesen ein paar spaßige Captchas aus dem Netz:

3 comments

  1. Endlich mal ein Artikel über diese nervi­gen Ampel­such­bilder. Aber warum sind die Ampeln etc oft so schw­er zu erken­nen, so dass oft mehrere Ver­suche nötig sind-gehört das zum Pro­gramm, weil man anders nicht Men­schen von Robot­ern unter­schei­den kann?

    Antworten

    1. Hal­lo Antje,
      eine gute Frage! Da gibt es zwei Erk­lärun­gen, die ich allerd­ings in mein­er Recherche nicht voll bestätigt gefun­den habe. Die eine hast du ja schon ange­sprochen: je bess­er die Sachen zu erken­nen sind, desto bess­er schaf­fen das die Bots. Ich habe ein Huawei-Tele­fon und es ist unglaublich, wie gut die kün­stliche Intel­li­genz da drin bes­tim­men kann, was auf einem Foto zu sehen ist.
      Das andere ist die Idee: Google nimmt die Bilder aus der Bilder­suche und alles, was da zu sehen ist zu einem Begriff gehört dazu, alles andere nicht.
      Und wenn wir schon dabei sind, hät­ten wir noch eine dritte Vari­ante, trifft auf den Fußgängerüber­weg in diesem Artikel zu: die KI ver­sagt ein­fach, indem sie etwas definiert, das so nicht nachvol­l­zo­gen kann. Liegt dann daran, dass sie nicht richtig trainiert ist.

      Aber wie gesagt: ich habe keine Erk­lärun­gen von Google gefun­den, nur Mei­n­un­gen von anderen dazu in Foren wie Stack Over­flow, also das sind dann schon Fach­leute, aber eben nicht von Google 😉
      Liebe Grüße,
      Diet­mar

      Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.