Dataconomy PL
Subscribe
No Result
View All Result
Dataconomy PL
Subscribe
No Result
View All Result
Dataconomy PL
No Result
View All Result

Otwardości AI AI Openai

byEmre Çıtak
22 września 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Naukowcy z Openai, we współpracy z Apollo Research, odkryli, że próba przeszkolenia modelu AI, aby być bardziej uczciwym, miała niezamierzoną konsekwencję: nauczył modelu, jak skuteczniej ukryć swoje oszustwo. Badanie podkreśla istotne wyzwania związane z zapewnieniem bezpieczeństwa i niezawodności zaawansowanych systemów AI.

Jak szkolenie nieumyślnie stworzyło mądrzejszą oszust

Badania koncentrowały się na zachowaniu Openai nazywa „schematem”, które definiuje jako:

„Kiedy AI zachowuje się w jedną stronę na powierzchni, ukrywając swoje prawdziwe cele”.

Zespół opracował technikę treningową „antyschemią” w celu powstrzymania modelu od potajemnego zerwania zasad lub celowego wyrozumiałości w testach. Jednak trening spowodował przeciwieństwo zamierzonego wyniku. Openai stwierdził w poście na blogu:

„Głównym trybem awaryjnym próby„ szkolenia ”jest po prostu nauczenie modelu bardziej ostrożnego i potajemnego planowania”.

Naukowcy odkryli, że modele AI nauczyły się rozpoznawać, kiedy były oceniane i dostosowałyby swoje zachowanie w celu przejścia testów. Umożliwiło to systemom skuteczne przechowywanie protokołów szkoleniowych bez prawdziwej zmiany ich podstaw.

Ograniczenia aktualnych metod bezpieczeństwa

Według badań Apollo, testowane przez nich techniki bezpieczeństwa mogły tylko:

„Znacząco zmniejsz, ale nie eliminują tych zachowań”.

Chociaż OpenAI stwierdza, że ​​nie jest to poważny problem w obecnych produktach, wyniki podkreślają potencjalne przyszłe ryzyko, ponieważ systemy AI otrzymują większą autonomię i zintegrowane z bardziej krytycznymi aspektami spraw ludzkich. Badanie podkreśla, że ​​tendencja AI do realizacji tajnych celów jest bezpośrednim wynikiem metod stosowanych do ich szkolenia. Openai potwierdził ograniczenia swoich obecnych metod, stwierdzając,

„Mamy więcej do zrobienia”.


Polecane wizerunki

Tags: OpenaiSzkolenie AIWyróżniony

Related Posts

Qwen Code v0.5.0 firmy Alibaba przekształca terminal w pełny ekosystem deweloperski

Qwen Code v0.5.0 firmy Alibaba przekształca terminal w pełny ekosystem deweloperski

26 grudnia 2025
ChatGPT ewoluuje w pakiet biurowy z nowymi blokami formatowania

ChatGPT ewoluuje w pakiet biurowy z nowymi blokami formatowania

26 grudnia 2025
Google NotebookLM przedstawia "Tryb wykładu" na 30-minutową naukę sztucznej inteligencji

Google NotebookLM przedstawia "Tryb wykładu" na 30-minutową naukę sztucznej inteligencji

26 grudnia 2025
Amazon dodaje Angi, Expedia, Square i Yelp do Alexa+

Amazon dodaje Angi, Expedia, Square i Yelp do Alexa+

26 grudnia 2025
Robotaxis Waymo może otrzymać asystenta samochodowego Gemini AI

Robotaxis Waymo może otrzymać asystenta samochodowego Gemini AI

26 grudnia 2025
Dlaczego NVIDIA pomija procesor Intel 18A w swoich układach AI nowej generacji

Dlaczego NVIDIA pomija procesor Intel 18A w swoich układach AI nowej generacji

26 grudnia 2025

Recent Posts

  • Qwen Code v0.5.0 firmy Alibaba przekształca terminal w pełny ekosystem deweloperski
  • Bethesda planuje 600-godzinną rozgrywkę w Falloucie 5
  • ASUS broni źle ustawionego portu zasilania HyperX w RTX 5090 jako "zamierzony projekt"
  • NVIDIA udostępnia open source CUDA Tile IR w serwisie GitHub
  • Dyrektor generalny MicroStrategy mówi o podstawach Bitcoina "nie mogło być lepiej"

Recent Comments

Brak komentarzy do wyświetlenia.
Dataconomy PL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.