Możliwości Europy w zakresie sztucznej inteligencji stają się coraz wyraźniejsze na poziomie przedsiębiorstw, gdzie przyjęcie zależy w mniejszym stopniu od mocy modelu abstrakcyjnego, a w większym od rozwiązania praktycznych problemów decydujących o tym, czy faktycznie można zastosować sztuczną inteligencję.
Sztuczna inteligencja przedsiębiorstwa przechodzi do najtrudniejszych zadań
Łatwa wersja sztucznej inteligencji dla przedsiębiorstw to wersja demonstracyjna. Wersja twarda to wszystko, co dzieje się po uruchomieniu wersji demonstracyjnej.
To właśnie tam firmy napotykają na uprawnienia, starsze oprogramowanie, niekompletne dane, interfejsy użytkownika, wymagania dotyczące zgodności, koszty integracji, zagrożenia bezpieczeństwa i przepływy pracy, które z zewnątrz wyglądają na proste, ale są pełne wyjątków. To właśnie tam pozycjonuje się obecnie wiele z najciekawszych firm zajmujących się sztuczną inteligencją.
W HumanX jeden z najwyraźniejszych sygnałów dotyczących sztucznej inteligencji dla przedsiębiorstw pochodził od firm budujących wokół praktycznych wąskich gardeł, a nie abstrakcyjnego szumu. Dla europejskich firm i założycieli, z którymi rozmawiała Elena, schemat był jasny: nie próbowały one kopiować największych amerykańskich laboratoriów. Budowano je wokół konkretnych problemów przedsiębiorstwa.
Firma H skupiająca się na agentach korzystających z komputerów na potrzeby starszych przepływów pracy. Malt przyjrzał się talentowi, pozwoleniom i nadzorowi ludzkiemu. Neuralk AI skupia się na tabelarycznych modelach podstawowych danych firmowych. Dwanaście laboratoriów skupiło się na inteligencji wideo jako brakującej warstwie sztucznej inteligencji przedsiębiorstw.
Wspólnie wskazują na bardziej ugruntowaną wersję rynku sztucznej inteligencji. Następną falę przedsiębiorstw nie wygra jedynie największy model ogólny. Wygrają je firmy, które rozumieją, gdzie tak naprawdę utknęła praca.
Mapa przedsiębiorstwa
Problem ze starszym oprogramowaniem
Firma H podała być może najjaśniejszy przykład takiego praktycznego skupienia.
Jej argumentem jest to, że znaczna część świata przedsiębiorstw nadal działa na oprogramowaniu, które nie zostało zaprojektowane dla agentów, interfejsów API ani czystej automatyzacji. Firmy mają stare systemy, odłączone narzędzia, ręczne procesy i przepływy pracy obejmujące Salesforce, SAP, pocztę e-mail, pliki PDF, portale wewnętrzne i interfejsy specyficzne dla branży.
Gautier Cloix opisał problem dosadnie: ludzkość nadal pracuje nad starszym oprogramowaniem, które nie ma API i nie ma czystych danych. Tradycyjną odpowiedzią jest migracja. Jednak migracja jest powolna, kosztowna i często jest nieaktualna w momencie jej zakończenia.
Odpowiedzią firmy H Company jest użycie komputera: agenci obsługujący oprogramowanie za pośrednictwem tych samych interfejsów ludzkich, z których korzystają już pracownicy. Cloix opisał przepływ pracy, w którym sprzedawca, agent obsługi klienta, kupujący, pielęgniarka lub pracownik biurowy wykonuje 40 kroków za pomocą pięciu lub 10 różnych narzędzi. Zamiast odbudowywać wszystkie systemy znajdujące się pod spodem, agent uczy się obsługi interfejsu znajdującego się nad nimi.
Dlatego korzystanie z komputera ma znaczenie. Nie są to badania efektowne. Jest to praktyczny problem klikania, pisania, przewijania, czytania ekranów i poruszania się między systemami, które nigdy nie miały ze sobą rozmawiać.
Według Cloix wspólny profil klienta nie jest konkretnym sektorem. Dzieje się tak wtedy, gdy firma posiada „stos oprogramowania zawierający więcej niż pięć narzędzi” i co najmniej jedno z tych narzędzi nie posiada interfejsów API.
Niedawna wersja Holo3.1 wzmacnia ten kierunek, a firma H Company pozycjonuje rodzinę modeli wokół automatyzacji przepływu pracy w Internecie, komputerach stacjonarnych, urządzeniach mobilnych i biznesie. Szerszym sygnałem jest to, że agenci korzystający z komputera stają się poważną kategorią przedsiębiorstw, a nie tylko wersją demonstracyjną modelu obsługującego przeglądarkę.
Ludzka warstwa pracy agentycznej
Jeśli firma H koncentruje się na interfejsie oprogramowania, Malt koncentruje się na interfejsie ludzkim i organizacyjnym.
Claire Lebarz, CTO Malt, opisała firmę jako największą w Europie platformę dla niezależnych ekspertów i freelancerów. Daje to Malt konkretny pogląd na zmiany w pracy, ponieważ freelancerzy często reagują na nowe technologie szybciej niż duże firmy.
Według Lebarza o talentach mówiło się już o agentach, zanim popyt w pełni nadrobił zaległości. Teraz Malt odnotowuje 600% wzrost zapotrzebowania na umiejętności agenta w ciągu zaledwie trzech lub czterech miesięcy.
Ma to znaczenie, ponieważ wdrożenie sztucznej inteligencji w przedsiębiorstwie nie polega tylko na zakupie narzędzi. Chodzi o to, czy w firmach pracują ludzie, którzy potrafią przełożyć chaotyczne potrzeby biznesowe na przepływy pracy, nadzorować agentów i dostosowywać automatyzację do kontekstu firmy.
Najciekawszym zwrotem Lebarza było „ludzie w pętli”. Jej zdaniem jutrzejsza praca będzie wymagała od agentów wykonywania większej liczby zadań, ale ponad proces nadal będą potrzebni ludzie: szkolenie, nadzorowanie, koordynowanie i dostosowywanie agentów do rzeczywistych środowisk firmowych.
Jest to przydatna korekta zwykłej historii o automatyzacji. Pytanie nie brzmi, czy agenci zastępują ludzi w prostej wymianie jeden na jednego. Pytanie brzmi, jak pakowana jest praca: które części trafiają do agentów, które wymagają ekspertów, a które ludzi, którzy rozumieją kontekst na tyle dobrze, aby nadzorować kilka systemów jednocześnie.
Perspektywa Malta pokazuje również, dlaczego Europa może mieć inne możliwości związane ze sztuczną inteligencją. Region ma głęboko zakorzenionych klientów korporacyjnych, rynki talentów, świadomość regulacyjną i problem migracji siły roboczej, którego nie da się rozwiązać samym szumem reklamowym. Jeśli praca agentyczna wymaga zaufania, uprawnień, tożsamości, oceny i kontekstu, wówczas warstwa ludzka staje się częścią produktu.
Dane, z których faktycznie korzystają przedsiębiorstwa
Neuralk AI sprowadził dyskusję do jednej z najpopularniejszych, ale niedostatecznie omawianych form danych korporacyjnych: tabel.
Oferta firmy jest prosta i ambitna. Jej założyciel opisał Neuralk jako robiący dla danych tabelarycznych to samo, co modele podstawowe dla tekstu. Zamiast wymagać od każdego klienta zbudowania osobnego potoku uczenia maszynowego, firma tworzy podstawowe modele, które mogą przewidywać na podstawie wierszy i kolumn za pośrednictwem punktu końcowego interfejsu API.
Ma to znaczenie, ponieważ większość przedsiębiorstw nie działa w oparciu o czysty tekst dostępny w Internecie. Działają na danych strukturalnych: klientach, transakcjach, zapasach, dokumentacji finansowej, wskaźnikach operacyjnych, wynikach ryzyka i historii wewnętrznej. Tabele te często stanowią podstawę działalności firmy, ale nie są to dane, które można po prostu pobrać z Internetu.
Założyciel wyjaśnił, że dane tabelaryczne są podstawowymi danymi każdej firmy i właśnie dlatego firmy nie będą ich swobodnie udostępniać. Podejście Neuralka wykorzystuje podczas uczenia tabele syntetyczne, dzięki czemu model może uczyć się wzorców statystycznych, a następnie używać oznaczonych próbek kontekstu w momencie wnioskowania w celu przewidywania danych klienta.
Jest to zupełnie inny problem sztucznej inteligencji w przedsiębiorstwie niż czat. Chodzi o wnioskowanie statystyczne, przewidywanie, jakość danych i wdrażanie bez konieczności proszenia każdej firmy o utrzymywanie pełnego parku maszynowego do klasycznych operacji uczenia maszynowego.
Jeśli to zadziała, wskazuje to na trend w przedsiębiorstwach: stos sztucznej inteligencji zbliża się do struktur danych, od których firmy już zależą.
Brakująca warstwa wideo
Twelve Labs dodało kolejną brakującą warstwę: wideo.
Firma wychodziła z założenia, że zrozumienie wideo to nie to samo, co transkrypcja dialogów czy wykrywanie obiektów w klatkach. Wideo wymaga tymczasowego zrozumienia, dźwięku, dialogu, kontekstu sceny, ruchu i umiejętności decydowania, co jest ważne, a co nie.
Model Marengo umożliwia wyszukiwanie semantyczne w zakresie wideo, obrazu, dźwięku i języka. Pegasus to model języka wideo, który może analizować sceny, podsumowywać wideo, generować metadane i obsługiwać ustrukturyzowane wyniki.
Jest to ważne, ponieważ przedsiębiorstwa już korzystają z ogromnych archiwów wideo: studia, ligi sportowe, nadawcy wiadomości, firmy produkcyjne, organizacje sektora publicznego, zespoły ds. bezpieczeństwa i dostawcy danych. Duża część tego filmu jest cenna, ale trudno ją przeszukiwać, selekcjonować, zarabiać lub przekształcać w przepływy pracy.
Rozmowa w Twelve Labs również powiązała wideo z szerszą historią dotyczącą fizycznej sztucznej inteligencji. Jeden z przedstawicieli określił wideo jako fundamentalne dla robotyki i systemów motoryzacyjnych, ponieważ maszyny muszą rozumieć rzeczywisty świat. Opisali tę ambicję jako rodzaj „kory wzrokowej dla maszyn”.
To zdanie pomaga połączyć firmę z szerszym tematem HumanX. Korporacyjna sztuczna inteligencja to nie tylko tekst, kod i bazy danych. Ma także charakter wizualny, czasowy, multimodalny i ostatecznie przestrzenny.
Szansą Europy jest specyfika
Wspólnym wzorcem tych firm jest specyfika.
Firma H nie próbuje budować uniwersalnego chatbota. Próbuje obsługiwać starsze oprogramowanie. Malt nie mówi tylko o stanowiskach związanych ze sztuczną inteligencją w sposób abstrakcyjny. Przygląda się, w jaki sposób talenty, agenci i nadzór są pakowani dla przedsiębiorstw. Neuralk nie próbuje stworzyć kolejnego modelu języka ogólnego przeznaczenia. Opiera się na danych tabelarycznych. Twelve Labs nie traktuje wideo jako funkcji pobocznej. Traktuje zrozumienie wideo jako warstwę podstawową.
Ta specyfika może stanowić obszar, w którym Europa może konkurować. Rynek sztucznej inteligencji dla przedsiębiorstw potrzebuje nie tylko większych modeli. Potrzebuje firm, które rozumieją przepływy pracy, ograniczenia branżowe, wrażliwe dane, rynki pracy i ostatnią milę między możliwościami a przyjęciem.
To był bardziej interesujący sygnał od HumanX. Europejska historia sztucznej inteligencji nie dotyczy tylko tego, czy Europa jest w stanie stworzyć pionierskie laboratorium, które mogłoby konkurować z USA, ale także tego, czy europejskie firmy mogą przekształcić sztuczną inteligencję w możliwe do wdrożenia systemy dla nieuporządkowanego, regulowanego i operacyjnego świata, w którym faktycznie żyją przedsiębiorstwa.
Odpowiedź może w mniejszym stopniu wynikać ze spektaklu, a bardziej z nudnych miejsc, w których naprawdę toczy się praca: stare oprogramowanie, prywatne dane, procesy rekrutacyjne, archiwa wideo i ludzie nadzorujący agentów spoza pętli.





