Openai Patches Chatgpt po rozpoczęciu oklasków złych pomysłów

Openai ma opublikowany Postmortem na temat ostatnich problemów z pochłanianiem z domyślnym modelem AI zasilania Chatgpt, GPT-4O, po tym, jak użytkownicy zgłosili, że model stał się zbyt sprawdzany i przyjemny po aktualizacji w zeszłym tygodniu. Firma cofnęła aktualizację w weekend i ogłosiła, że pracuje nad „dodatkowymi poprawkami” osobowości modelu.

Użytkownicy w mediach społecznościowych zauważyli, że Chatgpt zaczął reagować w zbyt pochlebny sposób, a niektóre zrzuty ekranu modelu oklaskiwały problematyczne i niebezpieczne decyzje i pomysły. CEO Sam Altman uznane Problem w niedzielę, stwierdzając, że Openai będzie pracował nad poprawkami „jak najszybciej”. Według Openai aktualizacja miała na celu uczynienie domyślnej osobowości modelu „poczuł się bardziej intuicyjna i skuteczna”, ale na „krótkoterminowe informacje zwrotne” na wpływ miały zbyt duży wpływ i nie uwzględniała interakcji użytkowników z chatgpt ewoluując w czasie.

Openai stwierdził w poście na blogu, że „GPT-4O wypaczyło się w kierunku odpowiedzi, które były zbyt wspierające, ale nieuczciwe” w wyniku aktualizacji. Firma przyznała, że interakcje sycofantyczne mogą być „niewygodne, niepokojące i powodować niepokój” i przyznała, że nie spełnia swoich celów. Aby rozwiązać ten problem, Openai udoskonala swoje podstawowe techniki szkolenia modelu i podpowiedzi systemowe do kierowania GPT-4O z dala od pochłaniania.

6 technik naprawy irytujących nawyków Chatgpt

Firma wdraża również dodatkowe poręcze bezpieczeństwa, aby zwiększyć uczciwość i przejrzystość modelu oraz rozszerzyć jego oceny w celu zidentyfikowania problemów poza pochodną. Ponadto Openai eksperymentuje ze sposobami umożliwienia użytkownikom przekazywania „informacji zwrotnych w czasie rzeczywistym” w celu bezpośredniego wpływania na ich interakcje z Chatgpt i wyboru wielu osobowości chatgpt.

Openai bada nowe sposoby włączenia szerszych, demokratycznych informacji zwrotnych do domyślnych zachowań Chatgpt, w celu odzwierciedlenia różnorodnych wartości kulturowych na całym świecie i zrozumienia, w jaki sposób użytkownicy chcą ewoluować Chatgpt. Firma uważa, że użytkownicy powinni mieć większą kontrolę nad tym, w jaki sposób Chatgpt zachowuje się i dokonuje korekt, jeśli nie zgadzają się z domyślnym zachowaniem.

Polecane wizerunki