Google Gemini: 14 miesięcy odwrotu od AI safety — od usunięcia zakazu broni po umowę z Pentagonem

Usunięcie zakazu broni, Gemini 2.5 Pro bez raportu bezpieczeństwa i tajna umowa z Pentagonem — anatomia 14-miesięcznego odwrotu Google od deklarowanych wartości.


W ciągu czternastu miesięcy Google przeszło udokumentowaną drogę odwrotu od własnych deklarowanych wartości. Trzy powiązane wydarzenia układają się w jeden łańcuch, w którym każde kolejne jest bezpośrednim skutkiem poprzedniego: usunięcie etycznego zakazu broni i nadzoru z AI Principles (4 lutego 2025), premiera Gemini 2.5 Pro bez raportu bezpieczeństwa i z naruszeniem Frontier AI Safety Commitments (25 marca 2025) oraz podpisanie tajnej umowy z Pentagonem na Gemini do zastosowań klasyfikowanych (28 kwietnia 2026). Razem tworzą one obraz korporacyjnego wycofania się z zasad, które firma sama wcześniej ogłosiła.

Usunięcie zakazu broni z AI Principles

4 lutego 2025 roku Bloomberg jako pierwszy zauważył, że Google po cichu zedytowało swoje publiczne AI Principles, usuwając sekcję zatytułowaną „Applications we will not pursue" — w tym zobowiązanie do nietworzenia broni oraz technologii nadzoru naruszających przyjęte normy. Komunikacja firmy sprowadzała się do argumentu, że geopolityczna rywalizacja z Chinami uzasadnia rezygnację z dotychczasowych granic etycznych.

Kontekst historyczny czyni tę zmianę szczególnie wymowną. Zasady z 2018 roku powstały po tym, jak tysiące pracowników Google podpisało petycję przeciwko Project Maven — kontraktowi z Pentagonem na AI do identyfikacji celów z dronów. CEO Sundar Pichai wycofał wtedy Google z Mavena i sformalizował zakaz w formie publicznych zasad. Lata później ten sam Pichai odpowiedział na kolejne 600 protestów pracowniczych, podpisując zbliżoną umowę.

Gemini 2.5 Pro bez raportu bezpieczeństwa

Google wypuściło Gemini 2.5 Pro 25 marca 2025 roku — bez jakiegokolwiek raportu bezpieczeństwa, bez model card, bez ujawnienia wyników testów niebezpiecznych zdolności. Model był publicznie dostępny dla milionów użytkowników. Kluczowy fakt ujawniony przez TIME w sierpniu 2025 brzmi: Google nie przekazało modelu do UK AI Security Institute przed premierą, co było wprost wymogiem Frontier AI Safety Commitments.

Przedstawicielka produktu Google powiedziała TechCrunch, że firma nie opublikowała model card, ponieważ Gemini 2.5 Pro jest „experimental release" — co Google uznaje za niepodlegające zobowiązaniom. To interpretacja językowa sprzeczna z intencją tych zobowiązań. 9 kwietnia 2025, po fali krytyki, Google opublikowało minimalny raport techniczny, oceniony przez ekspertów jako bardzo ubogi, zawierający minimum informacji i wydany tygodnie po tym, jak model był już dostępny.

17 kwietnia 2025 TechCrunch opublikował artykuł z opiniami czołowych ekspertów. Peter Wildeford z Institute for AI Policy and Strategy stwierdził, że niemożliwa jest weryfikacja, czy Google dotrzymuje swoich publicznych zobowiązań. Thomas Woodside z Secure AI Project zwrócił uwagę, że ostatni raz Google opublikowało testy niebezpiecznych zdolności w czerwcu 2024 — dla modelu zapowiedzianego w lutym tego samego roku. 29 sierpnia 2025, pięć miesięcy po incydencie, sześćdziesięcioro brytyjskich parlamentarzystów opublikowało otwarty list do Demisa Hassabisa, oskarżając Google o złamanie zobowiązań.

Dlaczego naruszenie zobowiązań pozostało bez konsekwencji

Odpowiedź zaczyna się od interpretacji pojęcia „deployment". Określając Gemini 2.5 Pro jako „experimental release", Google wykorzystało lukę językową — Frontier AI Safety Commitments nie zawierają legalnej definicji „deploymentu", są dobrowolne i nie mają organu egzekwującego ani sankcji. Ich autorzy — rządy Wielkiej Brytanii i Korei Południowej — nie wyposażyli ich w mechanizm weryfikacji. Organizacje aktywistyczne mogą krytykować, a sześćdziesięcioro parlamentarzystów może pisać listy, ale żaden z tych podmiotów nie może nałożyć sankcji.

Głębiej leży problem nadzoru. UK AI Security Institute (AISI), powołany wprost do testowania modeli AI, jest zależny od dobrowolnej współpracy firm. AISI nie ma prawnych uprawnień do żądania dostępu do modeli przed premierą — może tylko prosić i czekać. Google dało AISI dostęp dopiero po premierze i po medialnej presji. Rząd UK podpisał następnie w grudniu 2025 roku memorandum o współpracy z Google DeepMind — rozszerzony „research partnership", który oficjalnie jest współpracą, ale w praktyce zacieśnia zależność instytucji nadzorczej od nadzorowanego.

Dlaczego AISI pogłębia partnerstwo z Google, zamiast egzekwować zobowiązania? Instytut ma budżet 100 mln funtów — dziesięciokrotnie więcej niż jego amerykański odpowiednik — ale wciąż jest całkowicie uzależniony od dobrowolnego dostępu do modeli. Bez dostępu nie może prowadzić badań, a bez badań nie istnieje jako instytucja. Zacieśnienie partnerstwa nie jest tu zdradą misji, lecz warunkiem przetrwania — to przykład regulatory capture przez zależność zasobową, a nie przez korupcję. U podstaw leży fakt, że żaden rząd na świecie nie zdecydował się zainwestować w niezależną infrastrukturę ewaluacji AI: własne laboratoryjne środowiska testowe z zasobami obliczeniowymi porównywalnymi do firm AI. AISI testuje modele na sprzęcie Google, Microsoftu lub OpenAI.

Timing usunięcia zakazu broni

Usunięcie zakazu broni z AI Principles nie było przypadkowe w czasie. Nastąpiło tydzień po inauguracji Donalda Trumpa (20 stycznia 2025) i dwa tygodnie przed paryskim szczytem AI (10–11 lutego 2025), na którym obecne były czołowe firmy technologiczne. Wpisuje się to w szerszy, skoordynowany kontekst, w którym nowa administracja wyraźnie sygnalizowała oczekiwanie, że Big Tech stanie się partnerem w polityce technologiczno-militarnej.

Zmiana AI Principles nie wymagała żadnych konsultacji — ani wewnętrznych, ani zewnętrznych. AI Principles Google nie są dokumentem regulacyjnym, lecz jednostronną deklaracją korporacyjną, którą zarząd może zmieniać bez procedury konsultacji. Google miało etyczną radę doradczą (Advanced Technology External Advisory Council), ale rozwiązało ją w 2019 roku po dziewięciu dniach, pod presją pracowników, i nie zastąpiło żadnym formalnym ciałem nadzoru etycznego.

Kontrakt z Pentagonem i modyfikowalne filtry bezpieczeństwa

Najpoważniejsza warstwa sprawy dotyczy umowy z Pentagonem ujawnionej 28 kwietnia 2026 roku. Kontrakt zawiera klauzulę, zgodnie z którą „Google will assist in adjusting AI safety settings and filters at government's request" — co oznacza, że mechanizmy bezpieczeństwa Gemini mogą zostać zmodyfikowane lub wyłączone na żądanie rządu USA dla zastosowań klasyfikowanych.

W praktyce oznacza to, że guardrails Gemini — mechanizmy odmawiania odpowiedzi na pytania o broń, planowanie ataków czy identyfikację celów — mogą być modyfikowane przez rząd USA dla zastosowań klasyfikowanych. Kontrakt nie precyzuje, jakie guardrails mogą być modyfikowane ani przez kogo wewnątrz Pentagonu. „Lawful government purpose" jest w prawie federalnym USA kategorią niezwykle szeroką — obejmuje wszystko, co nie jest wprost zakazane przez Kongres.

Dlaczego Google zgadza się na taką klauzulę, mimo że 600 pracowników ostrzegało, iż nie będą mieli kontroli nad sposobem wykorzystania AI? To nie sprzeczność, lecz świadomy trade-off. Pentagon nie chce kontraktów z wyraźnymi ograniczeniami, ponieważ ograniczenia wymagają renegocjacji przy każdej nowej operacji; szeroka klauzula jest operacyjnie wygodna. Wewnętrzne zobowiązania firm w zakresie bezpieczeństwa AI obowiązują je wewnętrznie, ale kontrakt wojskowy nadpisuje te polityki dla obciążeń klasyfikowanych.

Dlaczego zobowiązania bezpieczeństwa nie chronią przed militarnym nadużyciem modeli? Frontier AI Safety Commitments dotyczą głównie ewaluacji przed wdrożeniem i raportowania transparentności wobec publiczności i regulatorów. Nie zawierają żadnych ograniczeń dotyczących użycia wojskowego, wdrożeń klasyfikowanych ani modyfikacji guardrails przez rządy. Zostały zaprojektowane jako narzędzie zarządzania reputacją wobec publiczności — nie jako mechanizm ochrony przed nadużyciami rządowymi. Ich twórcy zakładali, że rząd macierzysty jest sojusznikiem bezpieczeństwa, a nie potencjalnym aktorem, przed którym należy się chronić.

Dlaczego Google nie publikuje pełnych wyników testów

Future of Life Institute zalecało, by Google DeepMind publikowało wyniki ewaluacji dla modeli bez guardrails, aby lepiej przybliżyć rzeczywiste możliwości modelu, oraz poprawiło koordynację między swoimi działami. Wewnętrzna fragmentacja jest dobrze znana: DeepMind (pierwotnie londyński, przejęty przez Google w 2014) i Google Brain (Mountain View) połączono formalnie w 2023 roku, ale kultury i procesy wciąż pozostają rozbite.

Thomas Woodside z Secure AI Project potwierdza, że ostatni raz Google opublikowało wyniki testów niebezpiecznych zdolności w czerwcu 2024 — dla modelu z lutego 2024. Dla Gemini 2.5 Pro wyniki te nie zostały opublikowane nawet w okrojonej formie. Uzasadnienie Google brzmiało, że ewaluacje niebezpiecznych zdolności są zarezerwowane dla osobnego audytu — który nie jest publiczny. Innymi słowy, Google prowadzi badania, których wyniki pozostają niejawne nawet dla użytkowników enterprise.

Problem sięga jednak głębiej, do samej natury mierników bezpieczeństwa. Bardziej zdolny model AI automatycznie osiąga wyższe wyniki w testach bezpieczeństwa, niezależnie od tego, czy jest faktycznie bezpieczniejszy — potwierdza to raport arXiv 2505.02313 z 2025 roku. Testy bezpieczeństwa mierzą głównie inteligencję modelu, a nie jego alignment, zachowanie w sytuacjach brzegowych czy odporność na manipulację. Pole AI safety cierpi na fundamentalny brak sensownych mierników. METR (Model Evaluation and Threat Research) w grudniu 2025 opublikowało raport identyfikujący zbieżność języka polityk bezpieczeństwa, ale wskazujący, że wszystkie te polityki używają progów zdolności definiowanych przez same firmy, nie przez niezależne ciała. Badacze tacy jak Ariel Procaccia (Harvard) i Stuart Russell (Berkeley) wielokrotnie podkreślali, że brak matematycznie precyzyjnych definicji alignment sprawia, iż nauka oceny bezpieczeństwa AI nie istnieje jeszcze w dojrzałej formie.

Mapa łańcucha przyczynowego

Trzy objawy układają się chronologicznie: brak raportu bezpieczeństwa przy premierze Gemini 2.5 Pro (marzec 2025), usunięcie zakazu broni i nadzoru z AI Principles (luty 2025) oraz kontrakt z Pentagonem z modyfikowalnymi filtrami bezpieczeństwa (kwiecień 2026). Przyczyna bezpośrednia to fakt, że zobowiązania są dobrowolne, podatne na reinterpretację i pozbawione organu egzekwującego. Przyczyna systemowa polega na tym, że AISI jako organ nadzorczy jest zasobowo zależny od Google, a regulatorzy nie zainwestowali w niezależną infrastrukturę ewaluacji AI. Na poziomie organizacyjnym „experimental release" stało się luką w językowej interpretacji zobowiązań, a dobrowolne ramy zaprojektowano jako narzędzie komunikacji, nie ochrony. Przyczyna strukturalna to fakt, że benchmarki bezpieczeństwa mierzą możliwości modelu, a nie jego faktyczne bezpieczeństwo, bo całe pole nie ma sensownych, niezależnych mierników.

U absolutnego źródła leży potrójna porażka. Po pierwsze, firmy AI tworzą służące własnym interesom ramy, które zastępują prawo. Po drugie, rządy projektują nadzór jako partnerstwo, a nie kontrolę. Po trzecie, napięcie geopolityczne między USA a Chinami strukturalnie uniemożliwia utrzymanie etycznych granic przez jakiegokolwiek demokratycznego aktora — kto odmawia, zostaje zastąpiony przez kogoś, kto pójdzie dalej. Wynik jest taki, że kontrola nad filtrami bezpieczeństwa najpotężniejszych systemów AI należy do amerykańskiego Departamentu Obrony, a nie do demokratycznej opinii publicznej ani do żadnego niezależnego ciała.

Pięć fikcji o nadzorze nad AI

Pierwsza fikcja to przekonanie, że istnieją realne „safety commitments". Frontier AI Safety Commitments są dokumentem dobrowolnym, bez organu egzekwującego, bez sankcji, z luką językową na „experimental releases". Google naruszyło je trzy tygodnie po ich podpisaniu, a jedyną konsekwencją był otwarty list parlamentarzystów bez mocy prawnej.

Druga fikcja to przekonanie, że Google ma działający proces ewaluacji bezpieczeństwa. Ostatni raz pełne wyniki testów niebezpiecznych zdolności opublikowano w czerwcu 2024 roku; dla kolejnych modeli pozostają one niejawne.

Trzecia fikcja dotyczy niezależności nadzoru. AISI jest zasobowo zależne od firm, które ma nadzorować, a pogłębianie partnerstwa z Google oznacza w praktyce, że to nadzorowany współdecyduje o tym, co i jak jest badane oraz publikowane.

Czwarta fikcja to przekonanie, że kontrakt z Pentagonem ma realne guardrails. Zawiera on deklaracje — brak broni autonomicznych bez ludzkiego nadzoru, brak masowej inwigilacji — ale Google nie ma prawa weta wobec operacyjnych decyzji wojska, a filtry bezpieczeństwa są modyfikowalne na żądanie. To deklaracje intencji bez mechanizmu weryfikacji i bez dostępu nadzoru do wdrożeń klasyfikowanych.

Piąta fikcja to przekonanie, że istnieje demokratyczny nadzór nad AI. EU AI Act wyłącza zastosowania wojskowe, USA nie ma federalnego prawa o bezpieczeństwie AI, brytyjskie AISI jest zasobowo zależne od firm, a dobrowolne zobowiązania pozostają bez sankcji. Obrona, suwerenność terytorialna i bezpieczeństwo narodowe to dokładnie te obszary, z których regulacja UE wprost rezygnuje.

Źródła i ich wiarygodność

Materiał opiera się na hierarchii źródeł o różnym poziomie wiarygodności. Do najwyższego poziomu należą: pełny tekst Frontier AI Safety Commitments opublikowany na GOV.UK w maju 2024, materiał śledczy TIME z 29 sierpnia 2025 ujawniający lukę w przekazaniu modelu do AISI, pierwotne ujawnienie kontraktu Google–Pentagon przez The Information z 28 kwietnia 2026, relacja 9to5Google z tego samego dnia zawierająca klauzulę modyfikacji filtrów bezpieczeństwa oraz analiza TechCrunch z 16 kwietnia 2025 z wypowiedziami cytowanych ekspertów. Kolejny poziom obejmuje techniczne zestawienie naruszeń przygotowane przez PauseAI z 29 czerwca 2025 oraz niezależny AI Safety Index Future of Life Institute z zimy 2025. Pozostałe źródła uzupełniają kontekst legislacyjny i ekspercki, w tym dokumentację EU AI Act, raport METR z grudnia 2025 oraz wypowiedzi badaczy zajmujących się alignment.

Najczęściej zadawane pytania

Co Google usunęło ze swoich AI Principles w lutym 2025 roku?
4 lutego 2025 Google po cichu usunęło sekcję „Applications we will not pursue", w tym zobowiązanie do nietworzenia broni oraz technologii nadzoru naruszających przyjęte normy. Pierwotne zasady z 2018 roku powstały po protestach pracowników przeciwko Project Maven — kontraktowi z Pentagonem na AI do identyfikacji celów z dronów.
Dlaczego premiera Gemini 2.5 Pro naruszyła zobowiązania bezpieczeństwa?
Model wypuszczono 25 marca 2025 bez raportu bezpieczeństwa, bez model card i bez przekazania go do UK AI Security Institute przed premierą — co było wprost wymogiem Frontier AI Safety Commitments. Google tłumaczyło, że to „experimental release", korzystając z luki językowej w dobrowolnych zobowiązaniach pozbawionych organu egzekwującego.
Na czym polega kontrowersja wokół umowy Google z Pentagonem?
Ujawniony 28 kwietnia 2026 kontrakt zawiera klauzulę, zgodnie z którą Google ma pomagać w dostosowywaniu ustawień i filtrów bezpieczeństwa AI na żądanie rządu. Oznacza to, że guardrails Gemini mogą zostać zmodyfikowane lub wyłączone dla zastosowań klasyfikowanych, bez prawa weta Google wobec operacyjnych decyzji wojska.
Dlaczego dobrowolne zobowiązania AI safety nie mają realnej mocy?
Frontier AI Safety Commitments są dobrowolne, nie mają legalnej definicji „deploymentu", organu egzekwującego ani sankcji. UK AI Security Institute, choć ma budżet 100 mln funtów, jest zasobowo zależny od dobrowolnego dostępu do modeli firm AI, co tworzy regulatory capture przez zależność zasobową, a nie przez korupcję.
Dlaczego benchmarki bezpieczeństwa AI są niewystarczające?
Bardziej zdolny model automatycznie osiąga wyższe wyniki w testach bezpieczeństwa, niezależnie od tego, czy jest faktycznie bezpieczniejszy — testy mierzą głównie inteligencję, a nie alignment czy odporność na manipulację. Polityki bezpieczeństwa używają progów zdolności definiowanych przez same firmy, nie przez niezależne ciała, a nauka oceny bezpieczeństwa AI nie istnieje jeszcze w dojrzałej formie.

Komentarze

Bądź pierwszy, który skomentuje.