ML 2.0: машинное обучение для всех

Автоматизированные инструменты для научных исследований, разработанные MIT и Feature Labs, выпустили свой первый продукт AI.

Сегодня, когда предприятия хотят использовать машинное обучение для решения проблем, они должны нанять кавалерию специалистов. Даже простая проблема требует объединения нескольких ученых по данным, экспертов по компьютерному обучению и экспертов по области, для согласованивая приоритетов и обмена данными.

Этот процесс часто неэффективен, и для получения результатов требуется несколько месяцев. Он также решает проблему немедленно. В следующий раз, когда снова потребуется решение, предприятие должно повторить то же самое.

Одна группа исследователей MIT задалась вопросом: «Что, если мы попробуем еще одну стратегию? Что, если мы создадим средства автоматизации, позволяющие экспертам самим использовать ML, чтобы решить эти проблемы?»

В течение последних пяти лет Калян Верамачанени, главный научный сотрудник лаборатории информационных систем и решений MIT, вместе с Максом Кантером и Беном Шреком, который начал работать с Veeramachaneni в качестве студента MIT, а затем стал соучредителем Machine Labup, разработали строгую парадигму для прикладного машинного обучения.

Команда сначала разделила процесс на дискретный набор шагов. Например, один шаг включал поиск скрытых шаблонов с предсказательной мощностью, известный как «технология создания объектов». Другой называется «выбор модели», в котором наилучший метод моделирования выбирается из множества доступных опций. Затем они автоматизировали эти шаги, создав инструменты с открытым исходным кодом, чтобы помочь экспертам в своей области эффективно решать свои задачи.

В своей новой статье «Machine Learning 2.0: технические данные, управляемые AI продуктами», команда объединяет эти средства автоматизации, превращая необработанные данные в надежную, развертываемую модель за 7 этапов. Эта цепочка автоматизации позволяет специалистам по предмету, даже без опыта использования данных, использовать машинное обучение для решения бизнес-задач.

«Благодаря автоматизации ML 2.0 высвобождает экспертов по предмету, чтобы тратить больше времени на шаги, которые действительно требуют экспертизы в области, например, решение проблем, которые необходимо решить в первую очередь, и оценка того, как прогнозы влияют на результаты бизнеса», — говорит Шрек.

В прошлом году Accenture присоединился к команде MIT и Feature Labs, чтобы выполнить амбициозный проект — создать менеджера проектов AI, разработав и развернув модель машинного обучения, которая заранее предсказала бы критические проблемы и добавила опытных менеджеров проектов в области программного обеспечения.

Это была возможность протестировать инструмент автоматизации ML 2.0, Featuretools, библиотеку с открытым исходным кодом, финансируемую программой DARPA Data-Driven Discovery of Models (D3M) в реальныз условиях.

Veeramachaneni и его коллеги тесно сотрудничали с экспертами по области от Accenture на каждом шагу, от выяснения наилучшей проблемы для решения, с помощью надежной проверки тестирования. Первая модель, построенная командой, заключалась в прогнозировании производительности программных проектов вместо множества показателей. Когда тестирование было завершено, было установлено, что модель правильно прогнозирует более 80 процентов результатов.

Использование Featuretools включало серию человеко-машинных взаимодействий. В этом случае Featuretools сначала рекомендовал 40 000 функций для экспертов области. Затем люди использовали свой опыт, чтобы сузить этот список до 100 наиболее перспективных функций, которые затем использовались в работе по обучению алгоритму машинного обучения.

Затем эксперты области использовали программное обеспечение для имитации с использованием модели и проверяли, насколько хорошо она будет работать, когда появятся новые данные в режиме реального времени. Этот метод также расширяет протокол «train-test-validate», характерный для современного машинного обучения чтобы сделать его более применимым к реальному использованию. Затем модель была развернута, делая прогнозы для сотен проектов на еженедельной основе.

«Мы хотели применить машинное обучение (ML) к критическим проблемам, с которыми мы сталкиваемся в бизнесе технологических услуг», — говорит Санджив Вохра, мировой технологический специалист Accenture Technology. «Более конкретно, мы хотели убедиться сами, сможет ли помочь ML 2.0 от MIT прогнозировать потенциальные риски при использовании программного обеспечения. Мы очень довольны результатами и будем делиться ими, чтобы другие могли также получать пользу».

«В течение 20-ти лет задача применения машинного обучения к проблемам была сформулирована как исследовательский или технико-экономический проект или возможность сделать открытие», — говорит Верамачанени. «Благодаря этим новым средствам автоматизации теперь можно создать модель машинного обучения из необработанных данных и использовать их в течение нескольких недель», — говорит Верамачанени.

Команда намерена продолжать совершенствовать ML 2.0, чтобы сделать ее актуальной для как можно большего числа отраслевых проблем. «Это истинная идея демократизации машинного обучения. Мы хотим сделать ML полезным для широкого круга людей », — добавляет он.

В ближайшие пять лет мы, скорее всего, увидим рост использования ML 2.0. «По мере роста, разработчики смогут настроить приложение ML так же просто как например, установка базы данных, — говорит Макс Кантер, генеральный директор Feature Labs. «Все будет так же просто».

MIT Laboratory for Information and Decision Systems

Подробнее про инструмент https://www.featuretools.com/demos

Spread the love

Оставьте первый комментарий

Оставить комментарий