• /
11 мая 2020 г.

Почему Zapisano лучше фрилансеров, программ распознавания речи и бюро расшифровок

Запуск онлайн-платформы Zapisano.org в 2018 году поменял рынок расшифровки аудиозаписей на русском языке с точки зрения стандартов удобства работы. Сервис уже сэкономил десятки тысяч часов времени более чем 5 000 профессионалов, работающих с текстами, и не собирается на этом останавливаться.

Однако когда мы знакомимся с людьми, которые пока не сталкивались с задачей перевода аудиозаписей в текст, и рассказываем им о своей работе, обычно диалог продолжается одним из трех классических вопросов.

Это вопросы о трех альтернативных способах сделать расшифровку аудио: с помощью фрилансеров, программ распознавания речи и бюро расшифровок. Чаще всего в одной беседе мы в сравнительном ключе обсуждаем все три.

В этой статье мы расставляем все точки на i и подробно разобираем преимущества Zapisano перед тремя основными альтернативными решениями по переводу в текст аудиозаписей естественной русской речи.

Пост будет полезен как тем, кто в первый раз столкнулся с необходимостью расшифровать аудиозапись, так и тем, кто сталкивается с ней постоянно и хочет повысить эффективность процесса.

Почему Zapisano лучше фрилансеров

Постановка вопроса: «Зачем заказывать расшифровку аудио в компании, когда то же самое дешевле могут сделать фрилансеры».
Неоспоримый факт: фрилансеры могут сделать дешевле практически любую работу (даже дешевле, чем у других фрилансеров). Но вот вам еще один: дьявол кроется в деталях.

В данном случае деталь заключается в том, что ответственного фрилансера сложно найти, легко потерять и невозможно забыть. Поскольку мы постоянно находимся в активном поиске лучших талантов, со всей ответственностью предупреждаем: не у всех найдутся силы и время для повторения этого пути. Мы так часто сталкиваемся с самыми неожиданными проявлениями человеческого фактора, что могли бы написать о них отдельный пост, но лучше объясним коротко:
Мы создали Zapisano для того чтобы освободить наших клиентов от всех тягот поиска и переговоров с фрилансерами, рисков некачественно выполненной работы и срыва сроков. И как результат — сэкономить время и нервы.
С момента запуска заказа в работу в личном кабинете Zapisano вы можете больше ни о чем не беспокоиться и заниматься своими делами — ставка не вырастет, потому что «оказалось сложнее, чем я думал», а срок не сдвинется, потому что «появились более приоритетные проекты». Ну и конечно, мы не пропадем накануне сдачи, потому что «что-то не рассчитал по времени» и не опубликуем вашу работу в портфолио, потому что «это же я ее делал».

В общем, на нас можно положиться, и сделать это очень просто.

Почему Zapisano лучше автоматического распознавания

Постановка вопроса: «На дворе XXI век. Разве нельзя просто загрузить аудиозапись в программу, чтобы она всё распознала и выдала текст?»
Разумеется, загрузить аудио в программу очень просто, но если ваша задача — получить связный текст, а не отдельные слова, результат может вас не обрадовать. Для того чтобы объяснить, почему, сначала мы хотели бы дать небольшую справку о текущем состоянии дел в машинном обучении.

Небольшая справка о текущем состоянии дел в машинном обучении

Современные алгоритмы компьютерного распознавания речи демонстрируют чудеса при преобразовании в текст записей речи на языках без гибкой морфологии. Сразу оговоримся, что для получения превосходного результата запись должна быть сделана в тихой обстановке.

К таким языкам-счастливчикам относятся, например, английский, французский или испанский — в них количество словоформ в зависимости от рода, числа и времени минимально, а падежи и склонения вообще отсутствуют. Немного редактуры — и перед вами готовый к использованию текст.

Чуть хуже, но все же на достойном уровне алгоритмы преобразовывают в текст короткие голосовые команды на любых языках. Роботы привыкли слышать практически одни и те же фразы изо дня в день, а однообразие исходного материала — это залог хорошего результата при распознавании.
Однако все меняется, когда приходят «они»: помехи на записи, реальная манера людей говорить и... окончания великого и могучего.
К сожалению, та самая гибкость форм слов русского языка, которая придает ему красоту и изящество, представляет собой пока непреодолимый барьер при расшифровке живой русской речи.

Например, компьютерный алгоритм не способен различить и корректно записать падежные формы слова «знание»: «знании», «знания», «знаний». В разговоре мы попросту проглатываем окончания слов, справедливо предполагая, что собеседнику и так понятно, что было дальше. Но вот роботы в этот момент от растерянности начинают просто гадать.
Чаще всего в повседневной устной речи мы заканчиваем обозначение слова где-то на «одухотворящ». Далее следует невнятная комбинация гласных звуков, немного отличающаяся для разных чисел и падежей.
На слух невозможно правильно записать «также» — «так же», «ввиду» — «в виду» и другие омофоны. И чем более шумная обстановка вокруг, чем больше люди перебивают друг друга и чем меньше их речь похожа на язык из учебников по русскому и классической литературы, тем сложнее становится эта задача.

В итоге в транскрипте естественной русской речи приходится исправлять практически каждое слово, не говоря о необходимости расстановки знаков препинания и заглавных букв. При подсчетах временных затрат получается, что быстрее и проще набрать текст с нуля, чем исправлять ошибки робота. Мы регулярно тестируем новые алгоритмы распознавания, и пока машинам не удается существенно изменить баланс сил.

К счастью для носителей русского языка, есть и хорошие новости: у Zapisano есть команда, которая умеет слушать и любит на нем писать.

Так что до наступления сингулярности кропотливую работу по набору текста с аудиозаписей можно поручить нам.

Почему Zapisano лучше бюро по расшифровке аудиозаписей

Постановка вопроса: «Не все ли равно, в какой компании заказывать расшифровку?»
Мы не знаем, так же ли тщательно в других организациях выстроен механизм поддержания стабильно высокого качества расшифровок, как в Zapisano, поэтому в рамках этой статьи укажем только на один очевидный факт:
По меркам двадцатых годов XXI века работать с традиционными компаниями по расшифровке попросту неудобно.
Процесс выглядит примерно так: сначала нужно загрузить файлы с устройства в облако, создать и скопировать ссылку на них и отправить ее на расчет менеджеру через форму на сайте. Потом дождаться расчета менеджера и согласовать сроки и стоимость. Дороговато или слишком долго? Начинайте круг согласований по новой. После утверждения стоимости вы получите ссылку на оплату по почте или через мессенджер с подробной инструкцией. Не забудьте уведомить о факте оплаты для запуска заказа в работу, ок?

Уф, заказ сделан и оплачен — отлично. Ждем расшифровку на почту. Забыли, когда срок? Поищите письмо на почте, по-моему, заголовок был «Re:Re:Re:аудиофайл». А, нет — это позапрошлый заказ. Ладно, скоро должна сама прийти.

После получения расшифровки нужно организовать хранение файлов так, чтобы в них не запутаться и чтобы ничего не потерялось (спойлер: все равно потеряется). Для учета расходов и закрывающих документов нужно поискать ветку в почте…
Если честно, мы немного устали даже просто описывать процесс, поэтому лучше коротко напишем, как дела обстоят в Zapisano:

Zapisano — это не традиционное бюро, а удобный и современный сервис расшифровки с личными кабинетами. В системе можно рядом хранить исходные и конечные файлы, оплачивать заказы в один клик и гибко контролировать свои расходы за счет гибких тарифов.

Еще никогда раньше заказывать расшифровки на русском языке не было так просто и удобно — но этот факт не останавливает нас на пути к дальнейшему улучшению сервиса.

Резюме:
Если у вас возникла необходимость расшифровать аудиозапись в текст, и вы ищете простой способ сделать это, обратите внимание на сервис Zapisano.org — он проще и надежнее фрилансеров, точнее программ автоматического распознавания и удобнее любой другой компании по переводу аудио в текст.
Омофо́ны (греч. ὁμός «одинаковый» + φωνή «звук») — слова, которые звучат одинаково, но пишутся по-разному и имеют разное значение.

Список статей блога сервиса расшифровки аудиозаписей Zapisano

Как начать запись в Zoom до и после включения демонстрации экрана? Для записи звонка или конференции в Zoom используйте кнопку «Запись»​ в нижнем или верхнем меню в интерфейсе программы.