Команда начала работать над адаптивным звуком после того, как из-за пандемии мир перешел на видеоконференции и, в конечном итоге, на гибридную работу. В то время было трудно приобрести новое оборудование для конференц-залов из-за нехватки поставок. «Кроме того, у многих организаций изначально не было достаточного количества помещений для видеоконференций или не было ресурсов для оборудования специальных комнат для совещаний», — говорит Хуиб.
Командам необходимо было иметь возможность создавать специальные помещения для встреч без необходимости собираться вокруг одного ноутбука. Но позволить каждому участвовать со своего устройства и одновременно заставить замолчать «крики» гораздо сложнее, чем кажется.
«Представьте себе аудиосистему для кинотеатра. Вокруг вас несколько динамиков, и это приятное звучание, поскольку все они подключены к одному и тому же источнику звука и воспроизводятся с необходимой синхронностью», — объясняет Хенрик Лундин, руководитель отдела разработки программного обеспечения в Meet. «Теперь, если несколько устройств в комнате будут воспроизводить один и тот же звук несинхронно, это будет звучать ужасно. Вы получаете несколько копий одного и того же звука, как если бы вы находились в большом соборе. Аналогично, когда вы разговариваете в комнате с несколькими микрофонами на разных устройствах, они улавливают звук одновременно, но не работают на одних и тех же часах.
Тогда есть проблема эха. Вы, наверное, замечали, что иногда при использовании инструментов видеоконференций слышится эхо собственного голоса. «Причина, по которой вы не получаете это постоянно, заключается в том, что устройства, на которых проводятся собрания, имеют эхоподавитель внутри», — говорит Хенрик. «Это алгоритм обработки сигнала, который пытается определить, какая часть аудиосигнала с микрофона на самом деле исходит только из динамиков одного и того же устройства, а какая часть является вашим голосом. Это становится в 10 раз сложнее, если в одной комнате несколько ноутбуков передают потоковое аудио и подают сигналы друг другу в микрофоны.
Чтобы решить эту аудиозагадку, команда потратила много времени, собираясь в одной комнате и придумывая, как сообщить своим ноутбукам, что они находятся рядом друг с другом. Сначала они протестировали возможность присоединения людей к определенным заранее определенным группам внутри собрания. «Очевидно, что это было подвержено ошибкам, но это помогло нам протестировать синхронизацию всех микрофонов и динамиков ноутбука», — говорит Хенрик.
Потом попробовали использовать ультразвук. Издавая высокочастотные звуки, невидимые для человеческого уха, ноутбуки могут определять присутствие других ноутбуков поблизости и действовать сообща, как группа. Это избавило пользователей от необходимости вручную настраивать свои устройства или выбирать комнату, в которой они находились. «Но это было действительно сложно, потому что ультразвук должен был надежно работать на любом устройстве, а точнее: если звук исходит из соседней комнаты, он не должен думать, что вы находитесь в той же комнате», — говорит Хенрик. Команда внедрила новый тип ультразвука для повышения точности и отрегулировала частоту и громкость, чтобы максимально увеличить охват и не быть слышимым.
Как только Meet обнаруживает наличие нескольких ноутбуков, автоматически включается адаптивный звук, синхронизируя все микрофоны и динамики ноутбука без отключения каких-либо динамиков. Он переключается между микрофонами в зависимости от того, кто говорит, чтобы избежать обратной связи и эха. Кроме того, Meet использует серверную обработку и облачный шумоподавитель для улучшения качества звука и удаления фонового шума перед передачей звука другим участникам.
По всему Google ежедневные встречи уже используют адаптивное аудио, причем многие участники даже не подозревают об этом. «Это одна из тех технологий, которая снимает с пользователя когнитивную нагрузку. Им не нужно задаваться вопросом, правильно ли они настроены, прежде чем присоединиться к встрече», — говорит Ахмед Али, руководитель отдела дизайна взаимодействия в Meet. «Независимо от того, насколько сложна и прекрасна технология, стоящая за этим, с точки зрения конечного пользователя, каждый раз, когда они открывают свой ноутбук и присоединяются к совещанию, это просто работает. »