Openai ma wprowadzone Nowe narzędzie sztucznej inteligencji o nazwie Deep Research, które przeprowadza obszerne badania online dla użytkowników, zajmujące się zadaniami, od złożonych zapytań naukowych po spersonalizowane zalecenia dotyczące produktu. Usługa jest dostępna dla płacących klientów za pośrednictwem Chatgpt Chatbot OpenAI.
Co to jest głębokie badania?
Głębokie badania mogą generować kompleksowe raporty w ciągu zaledwie pięciu do 30 minut, co zwykle zajmuje użytkownikom „wiele godzin”, według Openai. Narzędzie analizuje różnorodne zasoby, w tym tekst, obrazy, pliki PDF i pliki pobierane przez użytkownika, w celu syntezy informacji podobnie jak analityk badawczy. Kevin Weil, dyrektor ds. Produktu Openai, podkreślił swoją zdolność do wykonywania złożonych zadań, porównując jego wyniki z wynikiem ludzkiego badacza.
Openai uruchamia O3-Mini, wciąż droższy niż Deepseek R1
Ta premiera następuje po wprowadzeniu innego agenta AI o imieniu operator, który pomaga w zadaniach takich jak rejestrowanie lotów i zarządzanie zamówieniami spożywczymi. Obie usługi są dostępne wyłącznie dla użytkowników subskrybowanych do planu Chatgpt Pro o wartości 200 USD na miesiąc, co wskazuje na strategiczne skupienie się na płatnych usługach subskrypcyjnych w celu sfinansowania tych zaawansowanych funkcji.
Model | Dokładność (%) |
---|---|
GPT-4O | 3.3 |
Grok-2 | 3.8 |
Sonet Claude 3.5 | 4.3 |
Myślenie gemini | 6.2 |
Openai O1 | 9.1 |
Deepseek-R1* | 9.4 |
Openai O3-Mini (medium)* | 10.5 |
Openai O3-Mini (High)* | 13.0 |
Deep Research Openai ** | 26.6 |
Narzędzie jest przykładem szerszego trendu w branży AI w kierunku rozwijających się agentów zdolnych do wykonywania zadań wieloetapowych przy minimalnym nadzorze. Konkurenci, w tym Microsoft Corp. i Anthropic, również badają podobne technologie w nadziei na zwiększenie wydajności zarówno w zadaniach osobistych, jak i zawodowych.
Sam Altman, dyrektor generalny Openai, wskazał, że rozwój takich agentów może stanowić znaczący przełom w sztucznej inteligencji. Pilność tego postępu podkreśla się poprzez zwiększenie konkurencji ze strony chińskich firm AI, takich jak Deepseek, które szybko rozwijają się w sektorze.
Pomimo swoich możliwości, Openai ostrzegł przed potencjalnymi ograniczeniami związanymi z głębokimi badaniami. Narzędzie może tworzyć wyprodukowane informacje i często myli wiarygodne źródła z plotkami. Użytkownicy mogą napotykać ograniczenia, takie jak niemożność przesyłania ponad 100 zapytań miesięcznie podczas początkowego wdrażania.
Uruchomienie głębokich badań zostało wykazane na wydarzeniu w Waszyngtonie, gdzie z powodzeniem skompilowało informacje o Albert Einstein, w tym generowanie odpowiednich pytań dotyczących hipotetycznych przesłuchań kongresowych. Raporty opracowane przez głębokie badania obejmują również cytaty, chociaż niedokładności mogą wynikać z zjawiska znanego jako „halucynacja” w AI.
Gaia | Poziom 1 | Poziom 2 | Poziom 3 | Avg. |
---|---|---|---|---|
Poprzednia SOTA | 67,92 | 67,44 | 42.31 | 63.64 |
Deep Research (Pass@1) | 74.29 | 69.06 | 47,60 | 67,36 |
Głębokie badania (Cons@64) | 78,66 | 73.21 | 58.03 | 72,57 |
Openai planuje szersze rozszerzenie dostępu do głębokich badań w przyszłości, skierowane do użytkowników subskrybowanych do planów Plus, Team i Enterprise. Narzędzie wykorzystuje wersję najnowszej technologii rozumowania firmy, OpenAI O3, która jest specjalnie zoptymalizowana pod kątem przeglądania internetowego i analizy danych.
Szkolenie Deep Research obejmowało rzeczywiste zadania wymagające zarówno możliwości przeglądania, jak i rozumowania. Stosuje również techniki uczenia się wzmocnienia, zwiększając zdolność do skutecznego nawigacji i syntezy informacji. Ostatnie oceny wykazały, że model osiąga bezprecedensową dokładność w złożonych zadaniach badawczych.
Openai poinformował, że w ocenie zatytułowanej Ostatni egzamin ludzkości model zasilania głębokimi badaniami uzyskał 26,6% dokładności, co jest znaczącym osiągnięciem dla systemów AI zajmujących się pytaniami na poziomie ekspertów u różnych przedmiotów. Ponadto, w odniesieniu publicznym GAIA, narzędzie przekroczyło poprzednie zapisy wydajności, pokazując możliwości, które wymagają rozumowania i płynności multimodalnej.
Chociaż narzędzie jest obecnie bardzo obliczeniowe, OpenAI przewiduje ulepszenia, aby uczynić je bardziej wydajnym i przyjaznym dla użytkownika, z planami przyszłych iteracji, które mogą zwiększyć jego funkcje i dostępność.
Głębokie badania stały się dostępne dla użytkowników CHATGPT w niedzielę, a przyszłe ulepszenia oczekują na platformy mobilne i stacjonarne. OpenAI przewiduje rozszerzenie możliwości narzędzia o dostęp do bardziej wyspecjalizowanych źródeł danych, wzbogacając w ten sposób kontekst i personalizację jego wyników.
Deepseek R1 vs O3-Mini w wydajności, kosztach i użyteczności showdown
Czy Głębokie badania Chatgpt są tego warte?
Tak, jeśli:
- Potrzebujesz szybkich, kompleksowych badań: Głębokie badania mogą generować szczegółowe raporty w ciągu 5 do 30 minut, oszczędzając godziny pracy ręcznej. Jeśli często potrzebujesz szybkich, dobrze zsyntetyzowanych informacji, to narzędzie jest zmieniającym grę.
- Obsługujesz złożone zadania: Narzędzie zostało zaprojektowane do wykonywania wieloetapowych zadań, co czyni je idealnym dla profesjonalistów, którzy muszą analizować dane, kompilować raporty lub przeprowadzać dogłębne badania w różnych domenach.
- Jesteś subskrybentem Chatgpt Pro: Jeśli płacisz już za plan Chatgpt Pro o wartości 200 USD za miesiąc, będziesz mieć dostęp do głębokich badań i innych zaawansowanych funkcji, takich jak Operator, co czyni go cennym dodatkiem do Twojego zestawu narzędzi.
- Doceniasz produktywność kierowaną przez AI: Jeśli chcesz wykorzystać sztuczną inteligencję, aby zwiększyć wydajność zarówno w warunkach osobistych, jak i profesjonalnych, głębokie badania są zgodne z szerszym trendem agentów AI wykonujących złożone zadania z minimalnym nadzorem.
- Jesteś w konkurencyjnej dziedzinie: Ponieważ konkurenci, tacy jak Microsoft i Antropic rozwijający podobne narzędzia, wyprzedzenie krzywej za pomocą zaawansowanych narzędzi badawczych AI może dać ci przewagę.
Nie, jeśli:
- Masz napięty budżet: Przy 200 USD miesięcznie plan Chatgpt Pro jest znaczącą inwestycją. Jeśli nie potrzebujesz często zaawansowanych narzędzi AI, koszt może nie uzasadniać korzyści.
- Obawiasz się dokładności: Głębokie badania mają ograniczenia, w tym potencjał do tworzenia wyprodukowanych informacji lub pomylania wiarygodnych źródeł z plotkami. Jeśli Twoja praca wymaga 100% dokładności, to narzędzie może nie być wystarczająco niezawodne.
- Przekraczasz limity zapytania: Podczas początkowego wprowadzenia użytkownicy są ograniczeni do 100 zapytań miesięcznie. Jeśli twoje potrzeby badawcze przekroczą ten limit, możesz uznać, że narzędzie jest restrykcyjne.
- Wolisz ręczne badania: Jeśli lubisz lub potrzebujesz praktycznej kontroli nad procesem badawczym, poleganie na narzędziu AI może nie być zgodne z twoim przepływem pracy lub preferencjami.
- Nie potrzebujesz zaawansowanych funkcji: Jeśli potrzeby badawcze są proste lub rzadkie, zaawansowane możliwości głębokich badań mogą być przesadzone i możesz osiągnąć swoje cele dzięki bardziej podstawowym narzędziom.
Wyróżniony obraz obrazu: Openai