Meta Platforms Inc ma na celu wzmocnienie swoich możliwości głosowych dzięki nadchodzącej wersji jej sztucznej inteligencji, LLAMA 4, jak donosi przez Czasy finansowe. Ten rozwój jest zgodny ze strategią Meta, aby skupić się na konwersacyjnych agentach AI zamiast tradycyjnych interakcji tekstowych.
Meta’s Llama 4: Przekształcanie sztucznej inteligencji z możliwościami głosowymi
W najbliższych tygodniach oczekuje się wprowadzenia ulepszonych funkcji głosowych w LAMA 4, mającym na celu ułatwienie dwukierunkowego naturalnego dialogu, w którym użytkownicy mogą przerwać sztuczną inteligencję, a nie ściśle przestrzegać formatu pytań i odpowiedzi. Ta zmiana pokazuje zaangażowanie meta w przekształcanie interakcji użytkownika z technologią AI.
Dyrektor generalny Mark Zuckerberg nakreślił ambitne cele dla firmy, wyznaczając 2025 r. Jako kluczowy rok dla swojej oferty produktów AI, które są w ramach rozwoju wśród zwiększonej konkurencji ze strony firm takich jak Openai, Microsoft i Google. Aby obronić te inicjatywy, Meta planuje zainwestować do 65 miliardów dolarów w 2025 r., Przedsiębiorczo koncentrując te wydatki na infrastrukturę centrów danych.
Meta AI zbliża się do 600 milionów użytkowników z LLAMA 3.3
Oprócz postępów w Lamie 4, Meta bada możliwość subskrypcji premium dla asystenta AI, Meta AI, która umożliwiłaby wykonywanie takich zadań, jak rezerwacje rezerwacji i tworzenie wideo. Firma rozważa również wdrożenie płatnych reklam lub sponsorowanych postów w wynikach wyszukiwania Meta AI.
Dyrektor ds. Produktu Chris Cox wskazał, że LLAMA 4 będzie działał jako „model omni”, umożliwiając mowę natywnie funkcjonowanie w systemie, eliminując w ten sposób potrzebę tłumaczenia głosu na tekst i powrót. Podkreślił znaczenie tej zdolności na konferencji Morgan Stanley Technology, Media & Telecom, stwierdzając: „Myślę, że wciąż owijamy głowy wokół, jak to jest potężne”.
Meta aktywnie omawia niezbędne poręczy dla najnowszego wyniku modelu LAMA, oceniając, czy zmniejszyć te ograniczenia. Dyskusje te pojawiają się pośród wywierań konkurencyjnych, ponieważ rywale, takie jak Openai i Elon Musk’s Xai, również postępują w rozmieszczaniu funkcji głosowych, w tym odrębnych ofert osobowości Openai i Grok 3, która zawiera „niezmieniony tryb”, który reaguje w celowo zastrzeżony sposób.
W ubiegłym roku meta zwróciła się do krytyki dotyczącej jej Model LAMA 2który niechętnie odpowiadał na łagodne zapytania, ujawniając bardziej elastyczną wersję w Lamy 3. Integracja poleceń głosowych jest również kluczową cechą inteligentnych okularów Ray-Ban Ray Ban, które zyskały popularność wśród konsumentów, co dodatkowo wskazuje strategię firmy w pozycji lekkich słuchawek.
Wyróżniony obraz obrazu: Dima Solomin/Unsplash