Нет, все стенограммы в Zapisano от начала и до конца набирают на клавиатуре люди. Не потому что мы хотим остаться мануфактурой в мире роботов — просто пока машинное распознавание не облегчает, а в большинстве случаев затрудняет получение финального документа с читабельным текстом. И вот почему.
В большинстве случаев запись ведется в неидеальных условиях: на ней присутствуют посторонние шумы, докладчики говорят одновременно, оговариваются, глотают окончания. Даже если программа верно записала большинство слов, распознанный текст нужно серьезно корректировать: расставлять знаки препинания и заглавные буквы, проверять правильность записи всех слов, удалять лишние, добавлять пропущенные, исправлять окончания. На практике такая корректура занимает больше времени, чем набор с нуля.
Сэкономить время можно только если медленно, четко артикулируя каждое слово, продиктовать текст Siri, яндексовской «Алисе» или Google Speech Recognition. Результат будет относительно лучше, но текст все равно придется редактировать. К тому же сама диктовка потребует времени и определенной сноровки. Таким образом, если речь идет о расшифровке аудиозаписей живых мероприятий, то пока быстрее и проще набрать текст с нуля. Мы продолжаем следить за изменениями в сфере машинного обучения, поэтому внедрим необходимые алгоритмы, как только это сможет повысить эффективность и снизить стоимость расшифровки.