Od 15 lat pracujemy za darmo dla Google? Tajemnice reCAPTCHA

1 miesiąc temu

Miliony internautów codziennie klikają dziwne litery i zdjęcia, myśląc, iż po prostu chronią stronę przed spamem. Tymczasem od 2009 roku te kliknięcia służą czemuś więcej. Okazuje się, iż przez lata nieświadomie pomagaliśmy Google w cyfrowej rewolucji, wykonując miliony godzin pracy, która normalnie kosztowałaby krocie.

Viralowy post na X autorstwa użytkownika Sharbel przypomniał światu o tej historii. Autor zasugerował też, iż przez cały czas wykonujemy dla Google darmową pracę, teraz trenując modele dla autonomicznych samochodów Waymo. Część faktów jest niepodważalna, inne stwierdzenia to nadinterpretacja. Sprawdźmy, co naprawdę się wydarzyło.

Początek genialnego pomysłu

We wrześniu 2009 roku Google kupiło firmę reCAPTCHA założoną przez Luisa von Ahna z Carnegie Mellon University. To, iż po przejęciu Google wykorzystało mechanizm do czegoś więcej niż tylko blokowania botów, jest faktem – Google przyznało się do tego we wpisie na swoim blogu. System służył do poprawy systemu rozpoznawania tekstu ze skanów. Mechanizm był prosty: użytkownik przepisywał słowa, których nie potrafiły jednoznacznie odczytać ówczesne algorytmy OCR.

Pilotażowym projektem było opisanie całego archiwum The New York Times od 1851 roku. Artykuł w „The New York Times” z 2011 roku podaje konkret: reCAPTCHA stała się główną metodą Google do uwierzytelniania tekstu w Google Books. Dwa różne programy OCR skanowały stronę, a gdy wyniki się różniły – słowo trafiało do CAPTCHA. Odpowiedzi były porównywane między użytkownikami, co pozwalało osiągnąć bardzo wysoką dokładność (powyżej 99 procent przy tekście sprzed 1900 roku, gdzie zwykły OCR mylił się w 10–30 procentach słów).

Sam twórca reCAPTCHy, Luis von Ahn, podkreślał, iż chodzi o „zamianę bezużytecznego wysiłku w coś pożytecznego”. Ten system pozwolił opisać kawał biblioteki Google.

Od tekstu do obrazów

Z czasem reCAPTCHA ewoluowała. Zamiast liter pojawiły się obrazki – znaki drogowe, sygnalizacja świetlna czy witryny sklepowe. To również nie było przypadkowe. Kliknięcia użytkowników pomagały w oznaczaniu elementów na zdjęciach, m.in. z Google Street View. Te dane wspierały rozwój systemów rozpoznawania obrazów i poprawiały działanie usług takich jak Mapy Google.

Dziś system działa jeszcze subtelniej. reCAPTCHA w dużej mierze analizuje zachowanie użytkownika – ruchy myszy, sposób przewijania strony czy czas reakcji – bez konieczności rozwiązywania widocznych testów.

Co z autonomicznymi samochodami?

Tutaj zaczynają się twierdzenia, których na razie nie da się podeprzeć źródłami czy relacjami świadków. Viralowy post sugeruje, iż użytkownicy reCAPTCHA „trenowali autonomiczne auta Google”. Brzmi efektownie, ale nie ma na to bezpośrednich dowodów.

Faktem jest, iż dane z oznaczania obrazów mogły wspierać rozwój szeroko pojętych systemów rozpoznawania obrazu. To dziedzina kluczowa dla pojazdów autonomicznych. Nie ma za to dowodów, iż Waymo trenowało swoje modele bezpośrednio na danych z Google Street View czy Map Google. Waymo korzysta przede wszystkim z własnych, specjalistycznie oznaczanych zbiorów danych. Twierdzenie o bezpośrednim i kluczowym wpływie reCAPTCHA na rozwój Waymo pozostaje więc spekulacją.

Ile „pracowaliśmy” dla Google?

Jak twierdzi autor posta, w szczycie popularności rozwiązywano 200 milionów CAPTCHy dziennie. W przeliczeniu daje to 500 tysięcy godzin pracy każdego dnia. Płatna adnotacja danych kosztuje podobno od 10 do 50 dolarów za godzinę. Zakładając najniższą stawkę, to 5 milionów dolarów darmowej pracy każdego dnia.

To pokazuje skalę projektu – i tłumaczy, dlaczego reCAPTCHA była tak skutecznym narzędziem do trenowania modeli. Jednocześnie warto pamiętać, iż użytkownicy w zamian otrzymywali niezakłócony dostęp do usług i ochronę przed spamem.

Wspomniany post możemy przeczytać tutaj:

https://t.co/VmJZdkrtHq

— Sharbel (@sharbel) March 17, 2026

Internauci jak zwykle nie zawiedli. Przypomnieli post z 2017 roku nawiązujący do Terminatora i zwrócili uwagę na bardzo aktualny problem natury etycznej związany z AI…

pic.twitter.com/UA02lcVVoI

— 𝘾𝙚𝙣𝙏𝙚𝙧𝙊 (@vjcentero) March 17, 2026

Historia reCAPTCHA dobrze ilustruje, jak sprytnie można połączyć bezpieczeństwo z pozyskiwaniem danych. Może nie trenowaliśmy bezpośrednio systemów autonomicznych aut, ale z pewnością pomogliśmy nauczyć maszyny „widzieć” i „czytać” świat. Google, oddawaj moje 100 milionów!

Źródło: Sharbel na X, Google, archiwum NY Times

AIciekawostkigoogleinternetsztuczna inteligencja

Idź do oryginalnego materiału