OpenAI wprowadza kolejną innowację do swojego narzędzia ChatGPT. Zaawansowany tryb głosowy, znany dotąd z analizy dźwięku, zyskuje możliwość analizy wideo w czasie rzeczywistym. Nowa funkcja jest już dostępna dla użytkowników z subskrypcjami Plus i Pro, choć jej wdrożenie w Europie pozostaje wciąż na etapie planowania.
Rozszerzenie funkcji trybu głosowego o analizę wideo pozwala ChatGPT na interpretację treści wizualnych w trakcie ich odtwarzania. Podobnie jak w przypadku analizy audio, chatbot potrafi w czasie rzeczywistym odpowiadać na pytania dotyczące przedstawionych w filmie szczegółów. Przykładowo, w demonstracji udostępnionej przez Kevina Weila, lidera produktu w OpenAI, ChatGPT poprawnie zidentyfikował osoby w przebraniu Świętego Mikołaja i renifera na filmie na żywo.
Nowa funkcjonalność jest kolejnym krokiem w rozwijaniu zdolności wielomodalnych chatbotów, ale pozostaje niedostępna dla europejskich użytkowników. OpenAI zapowiada, iż możliwość analizy wideo trafi na ten rynek w przyszłości, jednak konkretna data wdrożenia nie została jeszcze podana.
Użytkownicy w Europie, a także klienci korporacyjni i edukacyjni, muszą więc uzbroić się w cierpliwość.