Відеоконференції, подкасти та вебінари стали популярними під час пандемії 2020 та 2021 років, коли віддалена робота стала частиною нової норми. З пандемією зараз у дзеркалі заднього виду, технології відеозв’язку не показали жодних ознак сповільнення.
Що мене смішило, так це те, що, незважаючи на поширеність відеокомунікацій, надто мало уваги приділяється тому, наскільки неприємно ми часто виглядаємо на камеру, використовуючи недостатні веб-камери з низькою роздільною здатністю. Погане освітлення, в основному під час відеодзвінків з дому, безсумнівно, є великою проблемою. Веб-камери з роздільною здатністю Sub-HD, вбудовані в більшість ноутбуків, навіть висококласних, не допомагають.
Без професійних ресурсів, доступних у професійній телестудії, політики, знаменитості та експерти галузі часто виглядають жахливо, коли дають інтерв’ю дистанційно з дому.
Звичайні дзвінки в режимі відеоконференції з дому особливо вразливі до вигляду та відчуття «любительської години», особливо під час офіційної презентації, де блукаючий погляд (наприклад, не дивлячись прямо у веб-камеру) може відвернути увагу глядача.
Розташування веб-камери спричиняє цей небажаний ефект, оскільки камера зазвичай вбудована у верхній частині панелі ноутбука або на окремій підставці, яку важко розмістити перед дисплеєм настільного комп’ютера.
Оскільки звичайна відеоконференція з використанням настільного або портативного комп’ютера не має належної функції телесуфлера, яка є складною, громіздкою та дорогою, майже неможливо читати нотатки доповідача, не уникнувши дратівливого явища жахливого ракурсу веб-камери, яка дивиться то вгору, то вниз у ваш ніс .
Чи є якісь швидкі способи вирішити проблему погляду?
Є кілька способів пом’якшити цю проблему в типовому домашньому комп’ютері або ноутбуку. Однак ці підходи суто химерні й не усувають проблему.
Декілька компаній пропонують невеликі зовнішні веб-камери, часто без вбудованого мікрофона, щоб зменшити розмір пристрою та дозволити розмістити його в центрі екрана, перед будь-яким текстовим матеріалом або самим вікном перегляду відеопрограми, яку ви використовуєте.
У цих камерах використовується тонкий дріт, прикріплений до верхньої частини дисплея. Таким чином, ви дивитесь прямо у веб-камеру й бачите більшість, хоча й не весь, презентації чи текстового матеріалу, який ви представляєте.
Тим не менш, інший метод полягає у використанні прозорого шматка акрилового пластику, який дозволяє встановити майже будь-яку веб-камеру та підчепити її до верхньої частини дисплея, щоб веб-камера висіла перед центральною точкою дисплея.
Перевага цього підходу полягає в тому, що він звільняє вас від використання бажаної веб-камери. Недоліком є те, що розмір веб-камери та акриловий пластиковий пристрій часто закривають значну частину екрана, що робить її менш корисною як альтернатива телесуфлеру.
У майбутньому ми можемо побачити дисплеї ноутбуків і ПК із вбудованими веб-камерами за РК-панеллю, які невидимі для користувача. Хоча це ідеальне вирішення проблеми, яку я описав вище, недоліком є те, що вартість цих спеціальних дисплеїв буде дуже високою, і більшість виробників не пропонуватимуть її через наслідки еластичності ціни.
AI може зручно та економічно виправляти проблеми з зоровим контактом.
Ідея використання штучного інтелекту для пом’якшення або усунення зорового контакту під час відеоконференцій не нова. Якщо все зробити правильно, штучний інтелект може позбутися від необхідності купувати дороге обладнання телесуфлінгу, яке використовують телевізійні студії, або вдатися до деяких хитрих методів, які я описав вище.
Проблема використання штучного інтелекту для корекції зорового контакту на льоту (в прямому ефірі) або навіть у записаному сценарії полягає в тому, що для виконання більшої частини важкої роботи потрібна потужність процесора.
Apple Silicon має цю інтегровану можливість протягом кількох років із своїми мікросхемами iPhone. Небагато користувачів знають, що програма FaceTime від Apple має функцію корекції зорового контакту (яку можна вимкнути), яка гарантує, що ваш погляд буде сфокусований на центрі екрана, незалежно від орієнтації iPhone.
Налаштування контакту очима в програмі FaceTime від Apple
Microsoft також приєдналася до партії штучного інтелекту, щоб вирішити проблеми з зоровим контактом. Минулого року компанія оголосила, що додасть можливість зорового контакту в Windows 11, використовуючи потужність рішень Qualcomm Arm і переваги нейронного процесора (NPU) для покращення відео та аудіо на зустрічах, включаючи кадрування об’єктів, придушення фонового шуму. і розмиття фону.
Багато з цих функцій вже були доступні на пристрої Microsoft Surface Pro X, який використовує чіп Arm. Тим не менш, цього року Microsoft широко розгорне цю функцію на більш сумісних моделях від основних виробників комп’ютерів.
Трансляція Nvidia із зоровим контактом
Програма Nvidia Broadcast , яка працює на широкому спектрі зовнішніх графічних карт Nvidia, є надійним інструментом штучного інтелекту, який покращує відеодзвінки та спілкування на ПК на базі x86. Минулого тижня Nvidia розширила утиліту у версії 1.4, щоб підтримувати реалізацію контакту очима, створюючи враження, що об’єкт у відео безпосередньо дивиться на камеру.
Новий ефект Eye Contact регулює очі мовця для відтворення зорового контакту з камерою. Ця можливість досягається за допомогою потужності штучного інтелекту в графічних процесорах Nvidia для точного оцінювання та вирівнювання погляду.
Новий ефект контакту очей у Nvidia Broadcast 1.4 переміщує очі мовця, щоб імітувати контакт очей із камерою. | Автор зображення: Nvidia
Перевага підходу Nvidia полягає в тому, що можливості не обмежуються однією платформою чи додатком для відеоконференцій. Apple підтримує лише можливість корекції зорового контакту за допомогою програми FaceTime для iPhone. Однак я не здивуюся, якщо пізніше цього року Apple розширить цю можливість для користувачів macOS у поєднанні з можливістю Continuity Camera.
Крім того, Nvidia Broadcast надає функцію Vignette, яку можна порівняти з багатьма користувачами програми Instagram. Таким чином, Nvidia Broadcast може генерувати невиразне розмиття фону, щоб отримати туманне зображення, змодельоване штучним інтелектом, на вашій веб-камері, одразу покращуючи якість зображення.
Заміна фонових зображень під час відеоконференцій не є чимось новим. Тим не менш, підхід Nvidia, ймовірно, забезпечить кращу якість, оскільки він використовує потужність своїх графічних карт, які оптимізовані для створення відеоконтенту та ігор.
Заключні думки
Функція зорового контакту в додатку Nvidia Broadcast наразі знаходиться в бета-версії та поки не підходить для розгортання. Як і будь-яка бета-версія, вона страждатиме від неминучих збоїв, і ми повинні відкласти офіційне оцінювання її якості, доки не стане доступною робоча версія.
Крім того, Nvidia Broadcast — це не просто звичайна програма, а відкритий SDK із функціями, які можна інтегрувати в програми сторонніх розробників. Це відкриває новий цікавий потенціал для програм сторонніх розробників для безпосереднього використання функцій Nvidia Broadcast.
Незважаючи на це, я вражений деякими побічними реакціями, які з’явилися протягом останніх кількох років навколо можливості використання ШІ для корекції зорового контакту. Деякі технічні аналітики використовували такі фрази, як «фактор моторошності», щоб класифікувати цю функцію якнайнепривабливішим способом.
Дійсно, ця здатність надихне на багато, можливо, заслужених жартів, якщо наслідки виглядатимуть неприродно та штучно. Однак це моторошне позначення здається надмірним і нещирим. Можна зробити таку саму інсинуацію щодо використання макіяжу або розгортання розширених інструментів, які виправляють недоліки звуку під час відеодзвінка. Такі програми, як TikTok або Instagram, не існували б без фільтрів, які, на мій погляд, створюють набагато моторошніші зображення.
Подобається нам це чи ні, але відеоконференції збереглися як один із позитивних результатів постпандемічного світу. Ми повинні вітати, а не зневажати використання технології, яка сприяє більш продуктивним, переконливим і ефектним відеодзвінкам.