5 ошибок при внедрении глубокого обучения в компании
Коммерческий автор и переводчик Полина Кабирова специально для блога Нетологии адаптировала статью Гэнса Кесари о том, с какими трудностями столкнутся компании, решив использовать метод глубокого обучения.
Сегодня отовсюду слышно о головокружительных преимуществах метода глубокого обучения, но остаются сомнения — работает ли этот метод на практике и действительно ли использование глубокого обучения выгодно для бизнеса? Введение в глубокое обучение для бизнеса можно прочитать в статье Гэнса Кесари.
Хороший показатель зрелости инноваций — положительные результаты работы в условиях, непохожих на привлекательную рекламу. В лаборатории AI Labs компании Gramener мы изучали исследования в области глубокого обучения и на их основе искали решения для конкретных проблем клиентов.
Обучение в онлайн-универстете: курс «Big Data: основы работы с большими массивами данных»
В статье расскажу о неоднозначных результатах работы с глубоким обучением — успехах и неудачах. Первоначальный восторг исчез после столкновения технологии с реальным миром. Вот пять причин, почему даже перспективные проекты с глубоким обучением попадают в тупик.
1. Ожидание фантастического результата
Искусственный интеллект быстро становится частью нашей жизни — беспилотные автомобили, дроны-доставщики пиццы и устройства, считывающие сигналы мозга. Но многие технологии так и остались в лабораториях и используются в специальных условиях под тщательным контролем.
Между готовыми технологиями и вашими представлениями о них — тонкая грань. Вдохновившись возможностью решать сложные задачи, компании часто выбирают неподходящие методы.
Так компании разочаровываются в искусственном интеллекте. Они перестают доверять технологиям, и страх провала тормозит их.
Перед внедрением глубокого обучения нужно внимательно изучить, в каких областях оно уже может быть использовано. Несмотря на амбиции, лучше ожидать меньше, а предложить больше.
2. Недостаточно данных
Глубокое обучение не решает острой проблемы нехватки данных. Наоборот, для успешного анализа данных должно быть много — без них ничего не получится.
На графике показано, как с увеличением количества данных растет результат глубокого обучения
Например, для обучения простой системы посещаемости сотрудников с распознаванием лиц нужны их фотографии. Их можно снимать автоматически или загрузить наборами с разными особенностями (разные ракурсы, очки, усы, особенности освещения и так далее). Процесс сбора данных сам по себе быстро превращается в мини-проект.
Спонсоры часто уверены, что найти и собрать данные несложно. Но, приложив все усилия, компании все равно работают с неполными и неточными данными.
Из-за недостатка данных разница между готовой технологией и привлекательным прототипом может быть существенной.
3. Данных много, но они не систематизированы
Для глубокого обучения нужна большая база данных. Но даже миллиона значений будет недостаточно, если они не маркированы.
Данные нужно тщательно разметить, чтобы алгоритм мог обучаться. Об этом часто забывают.
Алгоритм может научиться распознавать людей только по картинкам, где фигура человека выделена в отдельную область. Нужно разметить изображения и подписать лица, обозначить эмоции человека, зафиксировать его голос и даже таблицу чисел подробно описать с помощью метаданных.
Размеченные данные со спортивными активностями, собранные USF (Центр исследования компьютерного зрения)
Может показаться, что это лишняя работа. На самом деле, это поможет в будущем избежать более сложного процесса — извлечения признаков из объектов (распознавания лиц по отдельным признакам, например, по глазам или по носу).
4. Результат не окупается
Усилия по сбору и разметке данных в сочетании с вычислениями на GPU (графическом процессоре) могут дорого обойтись. Если прибавить к этому непрерывную работу по разметке новых данных, обучению и настройке — стоимость технологии взлетит.
В некоторых случаях дешевле будет отложить процесс и найти сотрудников для ручной проверки и классификации данных. Работа с большими объемами и масштабируемость бизнеса — преимущества глубокого обучения, но не для всех компаний это приоритетно на первом этапе.
Исследования глубокого обучения не стоит на месте, поэтому важно заранее изучить общую стоимость использования этого метода. Иногда стоит подождать, пока цена снизится.
5. Способности алгоритма отпугивают пользователей
Эта проблема противоположна предыдущим. В случае, когда данных достаточно и метод подходит для задач компании, глубокому обучению находится идеальное применение.
Проблема в том, что алгоритм знает слишком много еще до того, как люди решат научить его. И это пугает. Так, может появиться соблазн использовать кросс-продажи, когда в них нет необходимости, или установить более жёсткий контроль над сотрудниками, отслеживая их внутренние переписки.
Здесь речь о вопросах этики и конфиденциальности данных клиентов и сотрудников. Если вы понимаете, что такие технологии могут отпугнуть целевую аудиторию, лучше откажитесь от них, несмотря на большой потенциал. Помните: чем больше сила, тем больше ответственность.
Выводы
Глубокое обучение имеет бесконечный потенциал и стремительно развивается. Но, чтобы метод работал и приносил прибыль, избегайте пяти главных ошибок:
- Неправдоподобные ожидания от метода.
- Недостаток данных для глубокого обучения.
- Большое количество несистематизированных данных.
- Результат не окупается.
- Алгоритм может отпугнуть пользователей.
Убедитесь, что данных достаточно, они размечены и подготовлены для обучения алгоритма, проверьте общую стоимость внедрения метода. Наконец, применяйте его правильно — глубокое обучение должно вдохновлять человека и помогать ему, а не вызывать страх.
Глубокое обучение может быть использовано вместе с другими методами. Всегда начинайте с простого анализа, затем тщательно изучите статистику, а машинное обучение применяйте только при необходимости. Когда этих методов недостаточно и вы готовы использовать дополнительные экспертные инструменты, подключите глубокое обучение.
Читать ещё: «Искусственный интеллект, машинное обучение и глубокое обучение: в чём различия»
Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Полный текст статьи читайте на Нетология