Kaskada запускает платформу для подготовки данных для моделей искусственного интеллекта

Источник · Перевод автора

Разработка функций или процесс использования знаний предметной области для извлечения функций из данных важен для настройки ИИ и производительности машинного обучения. Это также обычно сложно и требует переписывания функций перед их развертыванием. Часто отсутствует инфраструктура, которая устраняет разрыв между обучающими моделями и обслуживанием результатов ИИ в производственных средах.

Вот почему в 2018 году Бен Чемберс (Ben Chambers) и Давор Боначи (Davor Bonaci) основали компанию Kaskada, которая использует методы майнинга для вычисления и обслуживания функций искусственного интеллекта в режиме реального времени. Сегодня, после закрытия раунда финансирования в размере 8 миллионов долларов, стартап из Сиэтла, штат Вашингтон, объявил о всеобщей доступности своей платформы разработки функций для отдельных специалистов по данным и компаний после периода бета-тестирования с участием первых последователей.

Платформа Kaskada не требует настройки и принимает исторические данные из хранилищ данных и озер данных, получая сообщения из потоковых источников, таких как Apache Kafka и Amazon Kinesis. Он преобразует эти основанные на событиях данные в формат, пригодный для агрегирования и других вычислений, и позволяет специалистам по обработке данных выполнять вычисления, используя данные из подключенных источников, одновременно визуализируя распределения и детализируя выбросы.

По данным исследовательской компании Tractica, ожидается, что в ближайшие годы мировой рынок программного обеспечения для искусственного интеллекта испытает «массовый» рост, при этом выручка вырастет с 9,5 млрд долларов в 2018 году до ожидаемых 118,6 млрд долларов к 2025 году. Ряд стартапов пытается заработать на этом. на тенденцию – или уже сделали это – включая Determined AI, которая недавно привлекла 11 миллионов долларов для дальнейшего развития своих инструментов разработки моделей глубокого обучения для специалистов по данным и инженеров ИИ. Между тем, Iguazio получила 24 миллиона долларов за свой набор инструментов разработки и управления ИИ, а Clusterone – 2 миллиона долларов за свою платформу DevOps для ИИ, которая работает как с локальными серверами, так и с общедоступными облачными вычислительными платформами, такими как AWS, Azure и Google Cloud Platform. .

Действующие компании также стремятся занять часть растущего рынка подготовки данных с использованием искусственного интеллекта и машинного обучения. В декабре прошлого года Amazon представила SageMaker Data Wrangler, который якобы упрощает процесс разработки функций, позволяя разработчикам выбирать и импортировать данные из различных магазинов одним щелчком мыши.

Но Kaskada утверждает, что ее платформа – первая, которая сосредоточена исключительно на разработке функций и опыте обслуживания. С этой целью он включает в себя интерфейс для совместной работы для специалистов по данным и работает на базе собственной инфраструктуры данных для вычислений с использованием данных на основе событий и обслуживания функций в производственной среде. С помощью Kaskada специалисты по данным могут масштабировать, преобразовывать и кодировать функции, а также просматривать все функции модели на панели инструментов. Они также могут определять, какие функции экспортировать для обучения, продвижения в рабочую среду и тестирования, а также измерять производительность функций с течением времени и обновлять производственные версии функций, вызывая API магазина функций.

«Платформа разработки функций Kaskada предназначена для решения действительно сложных проблем с данными в машинном обучении», – сказал Боначи. «Команды по анализу данных теперь могут лучше работать вместе, создавать лучшие функции и получать результаты на совершенно новом уровне. Мне не терпится увидеть, какое влияние они окажут в ближайшие месяцы и годы».

Платформа Kaskada бесплатна для запуска, и специалисты по данным имеют возможность платить за добавление дополнительных пользователей, управление дополнительными данными и доступ к премиум-функциям.