Microsoft запускает приложение Group Transcribe, приложение для расшифровки и перевода личных встреч

Новый проект от собственный инкубатор, Microsoft «Гараж» – это новый взгляд на расшифровку собраний. Хотя на сегодняшний день существует ряд й для транскрипции в реальном времени, которые можно использовать на вашем телефоне – например, Otter.ai или приложение Google Recorder для устройств Pixel, – MicrosoftНовое приложение Group Transcribe переосмысливает расшифровку собраний как более совместный процесс, когда каждый одновременно записывает встречу на своем собственном устройстве для большей точности. Он также предлагает перевод в реальном времени для языков, на которых говорят в более чем 80 различных регионах.

Чтобы использовать приложение, один человек сначала инициирует встречу на своем собственном устройстве. Затем они могут пригласить других участников собрания присоединиться к сеансу через Bluetooth, сканируемый QR-код или поделившись ссылкой. После того, как другие участники присоединятся к сеансу и начнется встреча, каждый человек увидит, как транскрипт отображается в реальном времени на своем устройстве.

Кредиты изображений: Microsoft

Приложение, основанное на технологии речи и языка искусственного интеллекта, способно выполнять расшифровку с более высокой точностью и атрибуцией говорящего в зависимости от громкости говорящего, зафиксированной микрофоном каждого телефона, используемого во время встречи.

Сравнивая уровень громкости голоса человека, облачный сервис пытается определить, какое устройство ближе всего к говорящему, и языковые предпочтения этого говорящего. Это означает, что динамики также точно помечены в приложении, что может быть проблемой для других приложений для транскрипции, где записывает только один человек.

Кроме того, если участники встречи хотят говорить на своем родном языке, приложение может предоставить перевод на другие устройства на их родном языке.



Кредиты изображений: Microsoft

Microsoft говорит, что приложение разработано с учетом доступности, так как оно позволяет глухим, слабослышащим и не носителям языка более полноценно участвовать в собраниях, следя за транскрипциями и переводами в реальном времени.

Сам проект был построен Microsoft сотрудники, которые вместе говорят более чем на десятке разных языков и диалектов.

«Это может быть фантастический инструмент для общения. Я бы хотел, чтобы это разрушило барьеры для людей, говорящих на нескольких языках », – сказал Франклин Муньос, главный руководитель разработки, представляя проект.

Как и большинство облачных служб транскрипции, приложение не следует использовать для конфиденциальных встреч. Тем не мение, Microsoft построил детализированные данные и элементы управления конфиденциальностью, которые позволяют пользователям решать, когда и когда они хотят делиться своими данными разговора.

Кредиты изображений: Microsoft

Для работы собранные данные ввода аудио и текста отправляются в Microsoftонлайн-технологии распознавания речи и перевода – хотя и со случайно сгенерированным идентификатором, а не с вашим настоящим именем.

Пока Microsoft не сохраняет стенограммы собрания и записи сами по себе – они сохраняются на вашем устройстве – приложение действительно поощряет участников «вносить» свои записи собраний в Microsoft так что это может улучшить обслуживание.

Это позволяет Microsoft чтобы сохранить текстовые транскрипции, созданные для распознавания речи и звука, когда все участники собрания согласны принять участие в этом сеансе. Просматривая данные, Microsoft стремится со временем улучшить свои возможности распознавания речи и атрибуции говорящего. После этого доступ к пользовательским данным будет осуществляться на условиях NDA обоими Microsoft сотрудники и подрядчики из других компаний, которые работают на Microsoft, но не будет включать учетные данные докладчиков.

Рецензенты также будут иметь доступ только к случайным отрывкам аудио, а не к полным записям. И Microsoft говорит, что «деидентифицирует» записи собраний, удаляя длинные цепочки цифр, которые могут представлять такие вещи, как, например, номера кредитных карт или телефонные номера. По словам компании, пользователи могут удалить свои ранее опубликованные записи в любое время, но в противном случае они хранятся до 2 лет на зашифрованных серверах.

Поскольку у компании нет возможности на уровне администратора настроить или заблокировать параметр «взнос» для всех пользователей, люди должны тщательно взвесить преимущества и риски такой услуги. Это также Microsoft Проект «Гараж», то есть он должен быть более экспериментальным и может быть закрыт в любой момент.

В настоящее время приложение Group Transcribe доступно только для iOS.