Специальные цены!
 
 

Mozilla развивает свою систему распознавания речи

Mozilla развивает свою систему распознавания речи

Пользователям предлагается озвучить выводимые на экран фразы или поучаствовать в оценке качества данных, добавленных другими пользователями. В рамках проекта по развитию собственной открытой системы распознавания речи компания Mozilla ввела в строй сервис Common Voice, нацеленный на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи.

На основе полученных данных будет сформирована открытая и бесплатная база данных, которую без ограничений можно будет использовать в системах машинного обучения и в исследовательских проектах. Целью инициативы является накопление 10 тысяч часов c записями различного произнесения типовых фраз человеческой речи. В текущем виде база Common Voice формируется только для английского языка, но в дальнейшем планируется запустить аналогичные проекты по сбору голосовой информации и для других языков.

Например, накопленная база может оказаться полезной для других открытых проектов в области распознавания речи, таких как ххhttps://cmusphinx.github.io/ Sphinx]], Kaldi, VoxForge, ISIP, HTK и Julius. В настоящее время исследователям и разработчикам доступны только ограниченные наборы, а стоимость полноценных коллекций голосовых выборок исчисляется десятками тысяч долларов, что сильно тормозит независимые исследования в области распознавание речи.

В отличие от уже имеющихся решений проект Mozilla подразумевает построение и открытие качественной модели для систем машинного обучения, а также реализацию расширенных алгоритмов для более точного выделения речи при наличии постороннего шума. Сервис запущен как дополнение к более глобальному проекту, в рамках которого планируется выпустить полностью свободную систему распознавания речи, которая использует современные методы машинного обучения. DeepSpeech реализует в коде одноимённую архитектуру распознавания речи, предложенную исследователями из компании Baidu. В основе проекта Mozilla лежит движок DeepSpeech, реализованный с использованием открытой компанией Google платформы машинного обучения TensorFlow.

Из достоинств также отмечается отсутствие необходимости подключения отдельных компонентов для моделирования различных отклонений, таких как шум, эхо и особенности речи. Система DeepSpeech значительно проще традиционных систем и при этом обеспечивает более высокое качество распознавания при наличии постороннего шума. По уровню ошибок DeepSpeech демонстрирует заметно лучшие результаты, по сравнению с коммерческими системами Google Speech, Bing Speech и Apple Dictatio. DeepSpeech не использует традиционные акустические модели и концепцию фонем, вместо которых предлагается использовать хорошо оптимизированную систему машинного обучения на основе нейронной сети.

Уже существующие открытые проекты, такие как LibriSpeech, уже накопили базу в примерно 1 тысячу часов, в то время как для достижения приемлемого уровня ошибок в DeepSpeech требуется как минимум 10 тысяч часов. Обратной стороной DeepSpeech является то, что для получения качественного распознавания данная архитектура требует значительно большего объёма данных для осуществления обучения и их разнородного качества (недостаточно просто диктовки фраз в студии, нужны варианты в реальных условиях с разными голосами, шумами, фоновой речью, акцентом и т.п.). Кроме того, данные LibriSpeech в основном отражают только каноническое произношение носителем языка, в то время как проект Mozilla пытается охватить любые произношения и обеспечить хороший уровень распознавания английского языка не только для американцев и англичан.

Для взаимодействия с движком планируется использовать Web Speech API. Для использования распознавания речи в online-приложениях и на мобильных устройствах Mozilla разрабатывает систему Pipsqueak, представляющую собой серверное решение на основе архитектуры DeepSpeech. При этом движок будет достаточно легковесным и способным работать даже на портативных системах, таких как Raspberry Pi 3.


Дата публикации: 21.07.2017


Ещё новости


  27.08.2022  В Китае представлен перспективный «Москвич»? На автосалоне в Чэнду дебютировал 7-местный кроссовер Sehol X8 Plus за 14 500 долларов

Это — на первом этапе, а потом возможно расширение линейки или замена одних моделей на другие. Официально о новых автомобилях «Москвич» пока ничего не сообщается, но уже практически никто не сом...

  27.08.2022  В океане обнаружены колоссальные залежи сахара, о существовании которых не знали даже эксперты

Это означает, что концентрация сахара на морском дне примерно в 80 раз выше, чем в обычной почве. Сахар поступает в виде сахарозы (основного ингредиента сахара, используемого на кухне), и высвобождает...

  26.08.2022  20 000 потоковых процессоров, 36 ГБ памяти и шина разрядностью 512 бит. AMD работает над видеокартой-монстром, но она выйдет нескоро

Информатор приписывает ей компоновку с 13 (!) чиплетами: четырьмя модулями GCD (Graphics Compute Dies) и девятью MCD (Memory Complex Dies). Инсайдер принес очень интересные новости относительно перспе...

  27.08.2022  Власти Италии обратились к экстрасенсу, чтобы тот спас всех от засухи

Такое решение вызвано серьезными последствиями аномальной жары лета 2022 года: два из пяти источников воды коммуны пересохли.  В северном регионе Италии, коммуна Баярдо, Лигурия, местные власти обрати...

  09.11.2022  Перспективный «Москвич» уже появился в Казахстане? В соседней стране начали продавать JAC JS4 – ожидается, что его производство наладят в Москве на бывшем заводе Renault

Еще летом появились слухи, что эту же модель будут производить на московском заводе «Москвич», а недавняя неразбериха с российским анонсом JS4 лишь укрепила во мнении, что автомобиль действительно буд...



Все новости




Корзина
Товаров: 0
Сумма: $0
Курс (нал.) 1$ = 62.00 руб.
Курс (безнал) 1$ = 65.00 руб.

НОВОСТИ

09.11.2022
Перспективный «Москвич» уже появился в Казахстане? В соседней стране начали продавать JAC JS4 – ожидается, что его производство наладят в Москве на бывшем заводе Renault

30.09.2022
В следующем году Micron Technology резко сократит капитальные затраты

27.08.2022
В Китае представлен перспективный «Москвич»? На автосалоне в Чэнду дебютировал 7-местный кроссовер Sehol X8 Plus за 14 500 долларов

27.08.2022
В океане обнаружены колоссальные залежи сахара, о существовании которых не знали даже эксперты

27.08.2022
Власти Италии обратились к экстрасенсу, чтобы тот спас всех от засухи

27.08.2022
Российское приложение определит депрессию у человека по его манере говорить

27.08.2022
Это точно не убийца флагманов. OnePlus представила наушники... за 10 долларов

27.08.2022
Видео: геймплейный трейлер стильного экшена Gungrave G.O.R.E. с безжалостным антигероем

26.08.2022
20 000 потоковых процессоров, 36 ГБ памяти и шина разрядностью 512 бит. AMD работает над видеокартой-монстром, но она выйдет нескоро

26.08.2022
Флагман Xiaomi возвращается к истокам. Xiaomi 13 получит плоский экран впервые с момента выпуска Xiaomi Mi 9

Все новости

ОБЗОРЫ

14.03.2024
Сервер времени

07.03.2024
Восстановление операционной системы Windows без лишних проблем

07.03.2024
Эффективность и доступность при чистке компьютера

07.03.2024
Эффективное решение для проблемных ситуаций

02.03.2024
Как заменить клавишы на Macbook?

Все обзоры
 
   
   
ASUS A7U

от $1065 
RoverBook Discovery B214

от $980 
RoverBook Voyager B514

от $835 
LCD PC WindRover LP2001 AT7

от $0 
Периферия Руль с педалями T...

от $85 
 
      © 2003-2024, Ноутбуки на Буденовском
Тел. (495) (499) 115-03-45
E-Mail: