Микрофоны, скриншаринг и локальное видео: как Voximplant Web SDK управляет медиа в браузере
Сегодня я раскажу про модуль Hardware в Voximplant Web SDK. Этот модуль пришел на смену старой системе управления аудио- и видеоустройствами. Но сначала — немного об управлении устройствами в WebRTC-стеке и зачем все это нужно.
Редко, но у конечных пользователей бывает несколько микрофонов. Или бывает несколько динамиков: например обычные динамики и bluetooth-наушники; или динамик телефона и громкая связь для смартфона.
А вот две камеры в современном мире бывают очень часто. На планшетах и телефонах: обычная и фронтальная. На ноутбуках: встроенная и получше внешняя. И так далее и тому подобное. Пользователь может сильно растроиться, если по дефолту будет выбран не тот набор устройств и он никак не сможет их изменить. Это первое применение управлению медиа в WebRTC.
Второе применение — это тонкие настройки аудио и видео. Всякие эхоподавления, шумоподавления, установка разрешения видео, фреймрейта, баланс белого и прочего, что конкретно ваш браузер поддерживает.
Раньше для управлениями устройствами мы предоставляли интерфейс constraints и разработчику нужно было прописывать все ограничения и параметры запроса медиа самостоятельно. Вот небольшой пример полностью настроенного запроса аудио и видео:
const myConstraints = {
audio:{
sampleSize: 16,
channelCount: 2,
noiseSuppression: true,
echoCancellation: false
},
video:{
width: { min: 640, ideal: 1920, max: 1920 },
height: { min: 400, ideal: 1080 },
aspectRatio: 1.777777778,
frameRate: { max: 30 },
facingMode: { exact: "user" }
}
};
Это дает неимоверную гибкость при настройке аудио и видео, однако всегда есть «НО». Как показала статистика опроса поддержки, клиенты в основном не пользовались этой опцией, так как мы дружелюбная платформа и сами приучаем пользователей к простоте. Те же, кто рискнул использовать это, нередко отстреливали себе все чуть выше колена, так как браузеры имеют в этой точке пространства легкую несовместимость.
Теперь ясно, как мы дошли до жизни такой. Пора перейти к делу: бегло осмотрим модуль; для детального прочтения я оставлю ссылку на документацию на нашем сайте.
Входной точкой в этот модуль является StreamManager. Исторически сложилось [картинка со слоном.jpg], что многие части нашего Web SDK — синглтонгы, и этот класс не исключение: получить инстанс можно при помощи функции get (). Для этого есть море причин, но об этом в другой раз, пожалуй.
const streamManager = VoxImplant.Hardware.StreamManager.get();
С помощью StreamManager можно включить или выключить локальное видео и
получить медиастримы для него — по сути, это всё. Входная точка не очень большая, если смотреть на внешние интерфейсы.
(async () => {
try{
console.log('[WebSDK] Включаем локальное видео');
await streamManager.showLocalVideo();
console.log('[WebSDK] Выключаем локальное видео');
await streamManager.hideLocalVideo();
console.log('[WebSDK] Операция по подмигиванию диодом успешно завершена!');
} catch(e){
console.log('[WebSDK] Что-то пошло не так. Возможно, никакой камеры не существует?!');
console.error(e);
}
})();
Интересный факт о локальном видео: локальное видео никак не передается собеседнику. Например, пользователю можно показать картинку в HD, а передавать 320×240 или наоборот, если локальное видео прячется в углу. Чуть ниже будет о том, как провернуть такой фокус.
В StreamManager есть 3 события:
- DevicesUpdated — вызывается когда пользователь подключил/отключил микрофон или камеру;
- MediaRendererAdded — добавлено новое локальное видео или скриншаринг с превью;
- MediaRendererRemoved — удалено локальное видео или скриншаринг с превью.
Функцией getLocalMediaRenderers () полезно получать ссылки на DOM-элементы с локальным видео, если вы не сохранили объект себе.
streamManager.getLocalMediaRenderers().forEach(renderer => {
cont elementOfDOM = renderer.element;
elementOfDOM.addEventListener('on42',doSomething,true);
});
Перейдем к настройкам видео (самое вкусное, следите за руками). Внезапно CameraManager. Опять же, синглтон со скучной функцией get ():
const cameraManager= VoxImplant.Hardware.CameraManager.get();
Какие настройки мы вообще можем установить? Давайте посмотрим на интерфейс CameraParams:
Еще 3 опции отвечают за размер видео:
- можно пользоваться либо videoQuality (мы подготовили еще и enum VideoQuality с набором модных разрешений)
- или можно выставить размеры вручную в пикселях через frameHeight и frameWidth
Вернемся к CameraManager и применим настройки! Внутри есть 2 геттера и 2 сеттера настроек:
Все что с «Default» — настройки «по умолчанию», как не трудно догадаться. Они будут использоваться для получения локального видео, для новых входящих и исходящих звонков.
А теперь обещаный фокус:
console.log('[WebSDK] Позволим пользователю почувствовать легкую ностальгию без вреда для окружающих.');
await cameraManager.setDefaultVideoSettings({
frameWidth:320,
frameHeight:240,
frameRate:12
});
await streamManager.showLocalVideo();
cameraManager.setDefaultVideoSettings({
frameWidth:640,
frameHeight:480,
frameRate:25
});
const newCall = client.call('mySchoolFriendBoris');
Пара с Call в названии немного сложнее. Эти функции созданы, чтобы получать и устанавливать настройки в процессе звонка, который уже идет. При изменении настроек, возникнет событие CallEvents.Updated.
console.log('[WebSDK] Теперь очередь для ностальгии у Бориса.');
cameraManager.setCallVideoSettings(newCall,{
frameWidth:320,
frameHeight:240,
frameRate:12
});
newCall.on(VoxImplant.CallEvents.Updated,e => {
console.log('[WebSDK] Ностальгия Борису успешно доставлена.');
});
Осталось две функции CameraManager. Очень мощные, но сложные. В enum VideoQuality есть три интересных значения:
- VIDEO_QUALITY_HIGH;
- VIDEO_QUALITY_MEDIUM;
- VIDEO_QUALITY_LOW.
Закономерный вопрос: «Игорь! Если Web SDK знает лучшее, худшее и среднее качество, то почему нет метода для получения списка поддерживаемых веб-камерой разрешений?!» Цимес в том, что не знает.
И для того, чтобы узнать, нужно буквально перебрать все возможные разрешения. Что удалось получить — поддерживаются. Звучит довольно просто, но на деле это занимает до нескольких минут. Поэтому мы не можем сделать это в инициализации WebSDK, например. Чтобы вы могли сделать это в момент, максимально комфортный для пользователя — если вообще захотите это делать — и существует testResolutions. Результат работы функции неплохо было бы сохранить в localStorage и позже грузить через loadResolutionTestResult при перезагрузке страницы:
console.log('[WebSDK] Откинтесь на спинку кресла и отдохните, пока WebSDK опрашивает вашу камеру.');
const testResults = await cameraManager.testResolutions();
localStorage.setItem('defaultCameraResolutionTestResults',JSON.stringify(testResolutions));
И последнее по списку, но самое популярное: AudioDeviceManager. Класс очень сильно похож на CameraManager. Только для звука свои настройки отражены в интерфейсе AudioParams:
- strict — true отвечает за неукоснительное следование вашей воле;
- inputId — выбор микрофона. Список всех микрофонов можно получить через AudioDeviceManager.getInputDevices;
- outputId — выбор динамиков. Работает эта опция только в Chrome, остальные браузеры ее проигнорируют. Получить список устройств можно через getOutputDevices;
- noiseSuppression — подавление шумов. По умолчанию, подавление шумов включено и отлично работает. Но может возникнуть частичное пропадание голоса, если пользователь работает в помещении, где очень много говорят, например в колл-центре. Фильтр просто может немного ошибаться и резать лишнее. Если у вас есть проблемы подобного характера, стоит выставить эту опцию в false;
- echoCancellation — убирает эхо от микрофона. Ее стоит отключать вместе с предыдущей опцией;
- autoGainControl — включает встроеный в операционную систему механизм автоматической регулировки усиления микрофона. Опция не имеет побочных эффектов, но ее работа сильно зависит от операционной системы и оборудования. Иногда она может просто не работать и усиление будет постоянным, что тоже неплохо.