Сбор и разметка данных для машинного обучения

Собираем и размечаем данные любых типов — изображения, видео, речь, текст — для создания и совершенствования ваших решений на основе ИИ.

Вам больше не нужно осваивать сложные платформы для разметки данных, общаться с крауд-разметчиками и самостоятельно проверять данные.

Оказываем услуги по сбору и разметке тренировочных ML-данных под ключ

Изображения

Разметка и классификация данных
Классификация, разметка bounding box

Текст

Классификация, named entity recognition (NER)

Видео

Речь

Распознавание и обнаружение объектов, классификация
Расшифровка на 150+ языках, разметка тайм-кодами
Тестирование

Тестирование ASR

Юзабилити тесты

Images

Speech

Videos

Работаем по всему миру
Сергей Кузнецов, CEO
Берем на себя все заботы по сбору и разметке данных, чтобы вы могли сосредоточиться на внедрении продуктов и решений на основе ИИ.

Почему Zapisano?

Быстрые старт
и масштабирование

Время — деньги: чем быстрее вы получите первые результаты, тем быстрее сможете проверить работоспособность модели и перейти к следующей итерации.
Мы располагаем как собственной инхаус-командой, так и доступом к международному пулу разметчиков, насчитывающему более миллиона человек. Это позволяет быстро начать проект, а затем легко масштабировать команду на лету.

Детали под контролем

Менеджеры проектов и специалисты по сбору и разметке работают в тесной связи, чтобы не упускать важных деталей.
При составлении ТЗ всегда начинаем с обсуждения конечной цели клиента. Это позволяет спроектировать оптимальный процесс сбора и разметки, гибко управлять бюджетом и контролировать сроки выполнения проекта.
Clockwork
Saturn

Глубокий и разносторонний опыт

Мы выполнили более 360 проектов в сфере сбора и разметки данных: от простой классификации до сложнейших задач по сбору данных «в полях» и многоэтапной разметке.
Понимаем все тонкости и проблемные места разных типов проектов. Для выполнения сложных и уникальных задач собираем выделенные команды разметчиков, тестировщиков и аналитиков.
Swiss knife

Кейсы

Разметка речи
Расшифровали и разметили тайм-кодами 2 700 часов видеозаписей стримов на четырех языках для обучения сервиса синхронного видеоперевода AliExpress.
Сбор речевых данных
Собрали12 800 часов речевых данных (более 5,7 млн фраз) на пяти языках для разработки голосового помощника для вьетнамского автопроизводителя VinFast.
Сбор изображений
Собрали и разметили 25 000 изображений содержащих текст объектов на трех языках в 15 странах для создания функции Live Text в iOS от Apple.
  • Расшифровка и классификация эмоций сотрудников колл-центра

    Транскрибировали записи разговоров сотрудников колл-центра и классифицировали эмоции по 5 классам с расстановкой специальных тегов по тексту. Данные использовались для разработки системы распознавания эмоций сотрудников.

    Клиент: Сервис для аренды, покупки и оценки стоимости недвижимости (Россия)
    Объем: 600 часов
    Длительность фрагмента: 4 минуты, сегментация по предложениям: 10-15 секунд
  • Панорамная видеосъемка интерьеров квартир

    Нашли и произвели видеосъемку интерьеров 20 квартир в трех классах (одно-, двух- и трехкомнатных) камерой с обзором 360 градусов. Материалы использовались для разработки MVP системы создания 3D-моделей жилых помещений по одному видео.

    Клиент: Инновационный департамент банка (Россия)
    Объем: 20 квартир
  • Расшифровка переговоров железнодорожных диспетчеров

    Транскрибировали записи переговоров железнодорожных диспетчеров для идентификации внештатных ситуаций.

    Клиент: Оператор железнодорожных перевозок (Россия)
    Объем: 150 часов
    Длительность фрагмента: 30 секунд, сегментация по фразам: 5-10 секунд
  • Расшифровка переговоров менеджеров по бронированию

    Транскрибировали записи переговоров сотрудников отдела бронирования билетов для контроля ошибок и мониторинга конфликтных ситуаций.

    Клиент: Авиаперевозчик (Россия)
    Объем: 100 часов
    Длительность фрагмента: 5 минут, сегментация по фразам: 5-10 секунд


  • Расшифровка диалогов консультантов с клиентами

    Дословно и с идентификацией по голосам транскрибировали записи разговоров специалистов сервисного отдела сети магазинов бытовой техники, записанных на аудиобейджи.

    Клиент: Отдел ремонта ритейлера бытовой техники (Россия)
    Объем: 300 часов
    Длительность фрагмента: 5 минут, сегментация по предложениям: 10-15 секунд
  • Видеосъемка достопримечательностей в Лондоне

    Произвели видеосъемку Тауэрского моста, улицы Пикадилли и Трафальгарской площади в Лондоне на специальное оборудование по техническим гайдлайнам клиента. Видео использовались для разработки приложения дополненной реальности.

    Клиент: Инновационный департамент банка (Россия)
Будем рады помочь!
Какая у вас задача?
Пожалуйста, укажите тип вашего проекта — мы свяжемся с вами для обсуждения.
Задача