Chatgpt podobno zmniejsza poleganie na Reddit jako źródła danych

Openai wydaje się depriorytyzować treść z Reddit w celu szkolenia chatgpt, sygnalizując obrotność w kierunku bardziej niezawodnych i możliwych do weryfikacji źródeł informacji. Ta decyzja odzwierciedla fundamentalną zmianę w sposób opracowywania modelu AI, priorytetyzując dokładność danych konwersacyjnych w crowdsourcingu.

Powód zmiany

Przez lata Reddit był cennym zasobem do szkolenia sztucznej inteligencji, ponieważ jego szeroki zakres dyskusji stanowił naturalny, konwersacyjny styl, który pomógł modelom nauczyć się dialogu. Jednak dane te obejmowały również znaczące wady, takie jak dezinformacja, treści niskiej jakości i użytkownicy aktywnie próbują manipulować dyskusjami w celu wpłynięcia na odpowiedzi AI. Ta zgłoszona zmiana jest częścią szerszego trendu branżowego, który dąży do wykorzystania zaufanych i weryfikowalnych źródeł danych. Celem jest poprawa dokładności treści generowanych przez AI, zmniejszenie rozprzestrzeniania się dezinformacji i utrudnienie modeli do manipulowania.

Co to oznacza dla użytkowników

Odejście od Reddit wiąże się z kompromisem. Użytkownicy mogą oczekiwać, że otrzymają bardziej spójne i oparte na faktach odpowiedzi Chatgpt. Z drugiej strony dziwaczna, napędzana przez społeczność osobowość, którą różnorodne treści Reddita przyniosły reakcje modelu, może z czasem zanikać. Koncentruje się to na wiarygodności podkreśla przyszłość rozwoju sztucznej inteligencji, w której przejrzystość i zaufanie do danych szkoleniowych stają się niezbędne. Ponieważ modele AI są coraz bardziej zintegrowane ze środowiskami zawodowymi, akademickimi i biznesowymi, zapotrzebowanie na niezawodność ma pierwszeństwo przed chaotyczną i nieprzewidywalną naturą niezmienionych forów internetowych.

Polecane wizerunki