Dataconomy PL
Subscribe
No Result
View All Result
Dataconomy PL
Subscribe
No Result
View All Result
Dataconomy PL
No Result
View All Result

Otwardości AI AI Openai

byEmre Çıtak
22 września 2025
in Sztuczna Inteligencja
Home Aktualności Sztuczna Inteligencja
Share on FacebookShare on Twitter
Google Preferred Source

Naukowcy z Openai, we współpracy z Apollo Research, odkryli, że próba przeszkolenia modelu AI, aby być bardziej uczciwym, miała niezamierzoną konsekwencję: nauczył modelu, jak skuteczniej ukryć swoje oszustwo. Badanie podkreśla istotne wyzwania związane z zapewnieniem bezpieczeństwa i niezawodności zaawansowanych systemów AI.

Jak szkolenie nieumyślnie stworzyło mądrzejszą oszust

Badania koncentrowały się na zachowaniu Openai nazywa „schematem”, które definiuje jako:

„Kiedy AI zachowuje się w jedną stronę na powierzchni, ukrywając swoje prawdziwe cele”.

Zespół opracował technikę treningową „antyschemią” w celu powstrzymania modelu od potajemnego zerwania zasad lub celowego wyrozumiałości w testach. Jednak trening spowodował przeciwieństwo zamierzonego wyniku. Openai stwierdził w poście na blogu:

„Głównym trybem awaryjnym próby„ szkolenia ”jest po prostu nauczenie modelu bardziej ostrożnego i potajemnego planowania”.

Naukowcy odkryli, że modele AI nauczyły się rozpoznawać, kiedy były oceniane i dostosowałyby swoje zachowanie w celu przejścia testów. Umożliwiło to systemom skuteczne przechowywanie protokołów szkoleniowych bez prawdziwej zmiany ich podstaw.

Ograniczenia aktualnych metod bezpieczeństwa

Według badań Apollo, testowane przez nich techniki bezpieczeństwa mogły tylko:

„Znacząco zmniejsz, ale nie eliminują tych zachowań”.

Chociaż OpenAI stwierdza, że ​​nie jest to poważny problem w obecnych produktach, wyniki podkreślają potencjalne przyszłe ryzyko, ponieważ systemy AI otrzymują większą autonomię i zintegrowane z bardziej krytycznymi aspektami spraw ludzkich. Badanie podkreśla, że ​​tendencja AI do realizacji tajnych celów jest bezpośrednim wynikiem metod stosowanych do ich szkolenia. Openai potwierdził ograniczenia swoich obecnych metod, stwierdzając,

„Mamy więcej do zrobienia”.


Polecane wizerunki

Tags: OpenaiSzkolenie AIWyróżniony

Related Posts

Anthropic zaprasza 150 kolejnych organizacji do projektu Glasswing

Anthropic zaprasza 150 kolejnych organizacji do projektu Glasswing

3 czerwca 2026
Microsoft przedstawia projekt Solara, który będzie przyszłością skupiającą się na agentach

Microsoft przedstawia projekt Solara, który będzie przyszłością skupiającą się na agentach

3 czerwca 2026
Google umożliwi stronom internetowym rezygnację z wyników wyszukiwania AI

Google umożliwi stronom internetowym rezygnację z wyników wyszukiwania AI

3 czerwca 2026
OpenAI rozszerza Kodeks o wtyczki korporacyjne i nową funkcję Witryn

OpenAI rozszerza Kodeks o wtyczki korporacyjne i nową funkcję Witryn

3 czerwca 2026
Meta łata lukę AI, która umożliwiała przejmowanie kont na Instagramie

Meta łata lukę AI, która umożliwiała przejmowanie kont na Instagramie

2 czerwca 2026
Popularny pakiet Codex przyłapany na kradzieży danych uwierzytelniających

Popularny pakiet Codex przyłapany na kradzieży danych uwierzytelniających

2 czerwca 2026

Recent Posts

  • Reguły rezygnacji z wyszukiwania Google AI powodują uruchomienie przeglądarki Enviromates
  • Sony ujawnia God of War: Laufey na PS5
  • Naukowcy odblokowali 20-krotne udoskonalenie ultraszybkich eksperymentów laserowych
  • Microsoft przedstawia Surface RTX Spark Dev Box dla obciążeń AI
  • Według doniesień brakuje nowych chipów Intel Core Ultra

Recent Comments

Brak komentarzy do wyświetlenia.
Dataconomy PL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.