Mistral AI ma ogłoszony wydanie nowego interfejsu API do moderowania treści. To API, które już obsługuje chatbota Le Chat firmy Mistral, zostało zaprojektowane do klasyfikowania niepożądanych tekstów i zarządzania nimi w oparciu o różne standardy bezpieczeństwa i specyficzne aplikacje. Narzędzie do moderacji Mistral wykorzystuje dopracowany model językowy o nazwie Ministral 8B, zdolny do przetwarzania wielu języków, w tym angielskiego, francuskiego i niemieckiego, oraz kategoryzowania treści na dziewięć odrębnych typów: treści o charakterze seksualnym, nienawiści i dyskryminacji, przemocy i gróźb, niebezpiecznych lub przestępczych działania, samookaleczenia, informacje zdrowotne, finansowe, prawne i umożliwiające identyfikację.
Interfejs API moderacji jest wszechstronny i obejmuje aplikacje zarówno do nieprzetworzonego tekstu, jak i wiadomości konwersacyjnych. „W ciągu ostatnich kilku miesięcy zaobserwowaliśmy rosnący entuzjazm w branży i społeczności badawczej dla nowych systemów moderacji opartych na sztucznej inteligencji, które mogą pomóc w uczynieniu moderacji bardziej skalowalną i niezawodną w różnych aplikacjach” – Mistral podzielił się w niedawnym poście na blogu. Firma opisuje swoje podejście jako „pragmatyczne”, którego celem jest eliminowanie zagrożeń wynikających ze szkód generowanych przez modele, takich jak niewykwalifikowane porady i wycieki danych osobowych, poprzez zastosowanie szczegółowych wytycznych dotyczących bezpieczeństwa.
Moderation API rozwiązuje problemy związane z uprzedzeniami i potrzebami dostosowywania
Systemy moderacji treści oparte na sztucznej inteligencji mają potencjał do wydajnego i skalowalnego zarządzania treścią, ale nie są pozbawione ograniczeń. W przeszłości podobne systemy sztucznej inteligencji borykały się z uprzedzeniami, szczególnie w wykrywaniu stylów językowych powiązanych z określonymi grupami demograficznymi. Na przykład badania pokazują, że modele językowe często oznaczają frazy w języku afroamerykańskim w języku potocznym (AAVE) jako nieproporcjonalnie toksyczne, a także błędnie oznaczają posty omawiające niepełnosprawność jako nadmiernie negatywne.
Generatywna sztuczna inteligencja a predykcyjna sztuczna inteligencja: Pełne porównanie
Mistral zdaje sobie sprawę z wyzwań związanych ze stworzeniem bezstronnego narzędzia do moderacji, stwierdzając, że chociaż ich model moderacji jest bardzo dokładny, wciąż ewoluuje. Firma nie porównała jeszcze wydajności swojego interfejsu API z uznanymi narzędziami, takimi jak Jigsaw’s Perspective API lub API moderacji OpenAI. Mistral dąży do udoskonalenia swojego narzędzia poprzez ciągłą współpracę z klientami i społecznością badawczą, stwierdzając: „Współpracujemy z naszymi klientami nad tworzeniem i udostępnianiem skalowalnych, lekkich i konfigurowalnych narzędzi do moderacji”.
Batch API zmniejsza koszty przetwarzania o 25%
Mistral wprowadził także wsadowy interfejs API przeznaczony do obsługi dużych ilości żądań. Przetwarzając te żądania asynchronicznie, Mistral twierdzi, że wsadowe API może obniżyć koszty przetwarzania o 25%. Ta nowa funkcja jest zgodna z podobnymi opcjami przetwarzania wsadowego oferowanymi przez inne firmy technologiczne, takie jak Anthropic, OpenAI i Google, których celem jest zwiększenie wydajności klientów zarządzających znaczącymi przepływami danych.
Interfejs API moderacji treści Mistral ma być dostosowywalny do różnych przypadków użycia i języków. Model jest przeszkolony do obsługi tekstu w wielu językach, w tym arabskim, chińskim, włoskim, japońskim, koreańskim, portugalskim, rosyjskim i hiszpańskim. Dzięki tej wielojęzyczności model może uwzględniać niepożądane treści w różnych regionach i kontekstach językowych. Narzędzie Mistral oferuje dwa punkty końcowe dostosowane do kontekstu surowego tekstu lub konwersacji, spełniając różnorodne potrzeby użytkowników. Firma udostępnia szczegółową dokumentację techniczną i testy porównawcze, dzięki którym użytkownicy mogą ocenić wydajność modelu.
W miarę jak Mistral stale udoskonala swoje narzędzie, interfejs API zapewnia unikalny poziom dostosowywania, umożliwiając użytkownikom dostosowywanie parametrów w oparciu o określone standardy bezpieczeństwa treści.
Autor wyróżnionego obrazu: Mistral