Кук е съосновател на ZEGOCLOUDглобален доставчик на облачни комуникационни услуги за API и SDK за аудио и видео комуникация в реално време.
Гети
Комуникацията в реално време (RTC) се превърна в неразделна част от живота ни, тъй като светът бързо се движи към дигитално бъдеще, оказвайки влияние върху всичко – от виртуални срещи до видео стрийминг на живо и от социалните медии до развлеченията. Един от начините, по които RTC технологията може да продължи да напредва, е интегрирането на AI под формата на подобряване на видеото.
Видео разговорите често са били ограничавани от лошо осветление, качество на камерата и проблеми с честотната лента. Технологията за подобрение на видео, базирана на AI, може да помогне за решаването на тези и други проблеми и може да повлияе на начина, по който потребителите консумират медии и взаимодействат помежду си. Например технологията “селективно пренасочващо устройство” (SFU) може динамично да регулира качеството на видеото въз основа на мрежовите условия. Тази технология има няколко приложения, включително:
• Супер резолюция: Тази технология може да подобри разделителната способност на видеото отвъд оригиналната разделителна способност на видеото чрез генериране на допълнителни пиксели в реално време, което позволява по-резки видео разговори и отговаря на търсенето на висококачествено видео съдържание без необходимост от огромни инвестиции в инфраструктура.
• Подобрение при слаба светлина: Тази технология може да подобри видимостта и яркостта на видеоклипове, записани при условия на слаба светлина, което улеснява гледането и комуникацията във видео разговори в реално време, дори в слабо осветена среда.
• Интерполация: Тази технология използва алгоритми за създаване на нови видео кадри чрез анализиране на съседни кадри, което може да намали влиянието на мрежовото трептене и загубата на пакети върху видео потоците на живо.
• Портретна сегментация: Тази технология може да идентифицира и изолира хората от техния произход. Позволява прилагането на филтри или ефекти към фона, без да се засяга сниманото лице в реално време.
Случаи на използване на задвижвано от AI подобряване на видео
Социалните медии, развлеченията, мобилните игри и метавселената намират нови начини за включване на технология за подобрение на видео, задвижвана от AI, за да подобрят потребителското изживяване.
Например, филтрите и лещите на Snapchat използват AI за проследяване и модифициране на чертите на лицето в реално време по време на видео разговори. Microsoft също е в процес на разработване на нова функция за своя браузър Edge, която ще позволи на потребителите да увеличават мащаба на видеоклипове, възпроизвеждани в браузъра. Функцията, наречена “видео супер разделителна способност” (VSR), използва усъвършенствана AI технология за подобряване на качеството на видеото и увеличаване на яснотата.
В метавселената платформата Omniverse на Nvidia използва AI за симулиране на реалистично осветление и физика във виртуални среди, което позволява на потребителите да взаимодействат помежду си в реално време по по-завладяващ начин.
Тъй като технологията за аудио и видео комуникация в реално време се развива, потребителите ще имат по-високи очаквания и изисквания. В бъдеще те ще изискват завладяващо изживяване, което точно предава изражението на лицето и звука, създавайки усещане за присъствие във виртуални пространства. Потребителите също ще очакват реалистични и детайлни представяния на хора във виртуални зони, което може да се постигне чрез холографска проекция или технология за виртуално дистанционно управление.
Освен това, тъй като социалното царство на метавселената се разширява, ще има нужда от стабилно и безпроблемно взаимодействие с разширени функции, които позволяват социализиране, сътрудничество и ангажираност в реално време. Бъдещето на комуникацията в реално време ще зависи от способността на разработчиците да отговорят на тези нарастващи изисквания и очаквания.
Тъй като технологията за подобряване на видеото, задвижвана от AI, продължава да напредва, това може да доведе до нови възможности, като например създаване на хиперреалистично видео съдържание, което е почти неразличимо от реалността, персонализирано видео съдържание, базирано на биометричен анализ на зрителя и напълно завладяващо телеприсъствие изживяване, което създава чувството, че присъства на различно място. Тези подобрения ще играят важна роля в оформянето на бъдещето на комуникацията в реално време и ще продължат да бъдат фокус на разработчиците и иноваторите.
Тези подобрения са настроени да повлияят значително на пазара за разработка на приложения. Тъй като технологията продължава да напредва и става все по-достъпна, можем да очакваме да видим нова вълна от приложения, които са предназначени да се възползват от тези функции. Социалните медии, развлеченията, приложенията за игри, пазаруването на живо, образованието и приложенията за телездраве вероятно ще интегрират задвижвана от AI технология за подобряване на видеото, за да осигурят на потребителите по-ангажиращи и завладяващи изживявания.
Предизвикателства, пред които е изправено задвижваното от AI подобряване на видеото
Въпреки вълнуващите възможности на задвижваната от AI технология за подобряване на видеото, някои предизвикателства все още трябва да бъдат разгледани, като подобряване на точността, особено при анализиране и подобряване на сложни сцени, като тези с високо движение, слабо осветление или сложен фон.
Тези, които разработват тази технология, също ще трябва да обмислят обработката в реално време, тъй като тя изисква значителна изчислителна мощност и високи скорости на обработка, което може да отнеме време, за да се постигне. За да преодолеят това предизвикателство, разработчиците трябва да се съсредоточат върху подобряването на ефективността на AI алгоритмите и използването на специализиран хардуер, като GPU и TPU, за да ускорят скоростта на обработка.
Тревогите за поверителността също трябва да бъдат взети под внимание, тъй като технологията за подобрение на видео, задвижвана от AI, събира и анализира лични данни, като биометрична информация. Това поражда опасения относно поверителността и сигурността, особено след като технологията става все по-разпространена в приложения като телездраве и онлайн образование.
За да поддържат усъвършенстваната технология уместна и приложима на пазара, иноваторите трябва да идентифицират нуждите на разработчиците и да разберат как технологията може да бъде интегрирана в техните приложения. Те трябва да образоват и обучават пазара на най-новите технологии. Иновациите трябва да бъдат пакетирани в API, които позволяват на разработчиците на приложения да интегрират технологията в своите приложения, без да изискват значителна техническа експертиза.
От своя страна разработчиците на приложения трябва да са в крак с най-новите постижения в областта, за да останат конкурентоспособни. Те ще трябва да могат да използват иновациите, за да създадат уникални и запомнящи се изживявания за своите потребители.
За обикновения потребител това е просто въпрос на изчакване, за да видите какво носи бъдещето и наслаждаване на пътуването. Тъй като технологията за подобряване на видеото, задвижвана от AI, напредва и става все по-разпространена, потребителите могат да очакват по-завладяващи и ангажиращи изживявания в комуникацията в реално време, отколкото някога са били възможни. Потенциалът за тези подобрения за подобряване на качеството и достъпността на видео съдържание в различни индустрии е огромен и бъдещето на комуникацията в реално време е наистина вълнуващо.
Технологичният съвет на Forbes е общност само с покана за ИТ директори, технически директори и технологични ръководители от световна класа. отговарям ли на условията?