W branży spożywanej przez wyścig o sztuczną inteligencję firmy starają się unikać pozostawienia. Strach przed utratą, prowadzi wielu do ścigania krzykliwych trendów, ignorując podstawy, praktyka, który weteran branży nazywa „szalonym”.
Stanisław Petrovstarszy naukowiec danych w Capital.com Z ponad dekadą doświadczenia twierdzi, że kluczem do sukcesu jest przyjmowanie najnowszego, najbardziej hipedowego modelu, ale wspieranie kultury „zdrowia psychicznego”. W przypadku firm oznacza to priorytetowe ustalanie jasnych celów i danych o wysokiej jakości w związku z urokiem modnego bandwagonu AI.
Wyzwanie jest znaczące. Według raportu 2024 z alationoszałamiające 87 procent pracowników przytacza Jakość danych Problemy jako główny powód, dla którego ich organizacje nie spełniają celów danych i analizy.
„Centralnym paradoksem obecnego boomu sztucznej inteligencji jest nasza obsesja na punkcie wyników, jednocześnie zaniedbanie źródła” powiedział mi Petrov. „Pomimo wszystkich emocji, najważniejszym czynnikiem udanych projektów AI lub Data Science pozostaje jakość i znaczenie danych wejściowych – ale ponieważ jest to nieskrępowana i najtrudniejsza część, często się ignoruje”.
Aby temu przeciwdziałać, Petrov opanuje proste, ale rygorystyczne ramy przed rozpoczęciem jakiegokolwiek projektu: jaki jest cel biznesowy? Jaki jest potencjalny wpływ na biznes? Czy mamy dane, aby to się stało?
„Jeśli nie są one wyraźnie odpowiedzone, nie idziemy naprzód” – powiedział.
Plan wpływu
Petrov wskazuje na opracowanie wartości życia klienta lub CLV, modeluje jako doskonały przykład tej filozofii w akcji. Celem nie jest tylko zbudowanie algorytmu predykcyjnego, ale także rozwiązanie podstawowej potrzeby biznesowej: optymalizacji budżetów marketingowych.
„Celem jest zrozumienie prognozowanej wydajności kampanii lub Creative na wczesnych etapach i odpowiednio dostosowanie wydatków” – powiedział Petrov. Zauważył, że takie modele są kluczowe dla nowoczesnych zautomatyzowanych strategii, takich jak licytacja oparta na wartości na platformach takich jak Google Ads, które opierają się na przewidywanej wartości użytkownika.
Podczas gdy obecna epoka AI jest zdominowana przez złożone sieci neuronowe, Petrov powiedział, że w przypadku ustrukturyzowanych problemów danych, takich jak CLV, ustalone metody często działają najlepiej.
„Podejście do zwiększania gradientu działa dobrze dla danych strukturalnych”, powiedział Petrov, dodając kluczowe zastrzeżenie: „Oczywiście musisz wiedzieć, co robisz, i zrozumieć, jak dostroić hiperparametry i wybrać odpowiednią funkcję straty w oparciu o rozkład docelowy”.
Ostatnim i być może najważniejszym krokiem jest zapewnienie faktycznego stosowania modelu. Podkreślił, że pomiar wpływu często wymaga wyrafinowanych technik, takich jak analiza wpływu przyczynowego, aby udowodnić wartość modelu, gdy proste testy A/B nie są wykonalne.
„Wartość takiego modelu leży nie tylko pod względem technicznym, ale także w zakresie wpływu na rzeczywiste decyzje, skalowanie systemów i dostosowywanie się do potrzeb biznesowych” – powiedział Petrov.
Prowadzenie ewoluującego krajobrazu
To pragmatyczne podejście jest niezbędne, ponieważ naukowcy danych borykają się z instalacjami, szczególnie z nowych przepisów dotyczących prywatności i długotrwałej śmierci plików cookie trzeciej.
Google kontynuuje swój plan wycofania plików cookie dla wszystkich użytkowników Chrome, co jest ruchem Badanie z Lotame Stwierdzono, że 62 procent marketerów uważa, że negatywnie wpłynie na ich reklamę.
Petrov postrzega to nie jako jedno zdarzenie, ale jako długi, przyrostowy proces wymagający adaptacji.
„Jedną z głównych zmian jest oparcie się na ramy oparte na przyrostach i modelowanie miksów medialnych, aby zrozumieć prawdziwy wkład kanałów, zwłaszcza gdy rozpada się atrybucja bezpośredniej ścieżki”, powiedział Petrov.
Zmusza to ściślejszą integrację między zespołami danych i marketingowymi, polegając bardziej na technikach takich jak testowanie geo i modelowanie probabilistyczne.
Sposób myślenia, który określa lidera
Jeśli chodzi o budowanie zespołów zdolnych do poruszania się po tych wyzwaniach, Petrov uważa, że wyróżnik między młodszym i starszym naukowcem danych nie jest animem, ale sposób myślenia koncentrujący się na własności.
„Podczas gdy juniorzy mogą się wyróżniać w wykonywaniu dobrze zadań, seniorzy to ci, którzy proaktywnie definiują problemy, angażują interesariuszy i widzą rozwiązania w zakresie dostawy i iteracji”-powiedział.
Opisał kluczową realizację dla każdego profesjonalisty, który chce się rozwijać: „Kluczową zmianą sposobu myślenia jest zdaje sobie sprawę, że„ nikt nie przyjdzie ”, aby powiedzieć ci, co robić lub co jest właściwe. Musisz podjąć inicjatywę, podejmować własne decyzje i wziąć pełną odpowiedzialność za wyniki”.
Dla Petrova ta lekcja przyczyniła się z doświadczeniem.
„Pisanie kodu nie jest najtrudniejszą częścią pracy, nawet jeśli nie zawsze jest to łatwe” – powiedział. „Prawdziwym wyzwaniem jest integracja tej pracy z produktem, dostosowanie go do potrzeb biznesowych i przekonanie interesariuszy o jej wartości”.
Ta filozofia pragmatycznej własności rozciąga się na budowę infrastruktury, która obsługuje modele po ich uruchomieniu, dziedzinie znanej jako MLOPS. Zamiast budować zbyt złożone, „w pełni funkcjonalne platformy”, Petrov opowiada się za rozwiązaniami o prawej wielkości.
„Solidny system nie zawsze oznacza najbardziej złożony” – powiedział. „W wielu przypadkach proste, dobrze zaprojektowane rejestrowanie i ostrzeganie powiązane z kluczowymi wyjściami i wskaźnikami dryfu może obejmować 80 procent tego, co jest potrzebne”.
Koncentrując się na rzeczywistych problemach, danych jakościowych i namacalnym wpływie, przesłanie Petrova jest jasne: w epoce AI dawka zdrowia psychicznego może być najcenniejszym algorytmem ze wszystkich.





