NLP Cloud помогает разработчикам приложений добавлять языковую обработку

Источник · Перевод автора

Инструменты и сервисы НЛП набирают обороты, но разработчики часто сталкиваются с трудностями при внедрении моделей НЛП в производство. NLP Cloud – это новый стартап в области искусственного интеллекта, направленный на снижение барьеров для разработчиков, пытающихся создавать приложения для сортировки заявок в службу поддержки, извлечения потенциальных клиентов, анализа социальных сетей и разработки инструментов для экономического анализа.

НЛП существует уже несколько десятилетий, но интерес резко вырос с недавним появлением трансформаторов, нового типа нейронной сети. В 2017 году исследователи Google продемонстрировали, как преобразователи значительно улучшили скорость, производительность и точность инструментов НЛП. Трансформаторы сделали возможными гораздо более крупные модели Google BERT и OpenAI GPT-3. Возможности доступны через инновационные библиотеки с открытым исходным кодом Hugging Face и spaCy.

Разработка точных моделей и запуск моделей в производство – это два разных процесса. NLP Cloud намеревается восполнить этот пробел, уменьшив барьеры на пути к производству – предоставляя возможности NLP через API, а не на исходную модель искусственного интеллекта, которую необходимо внедрить в производство. Разработчикам нужно только позаботиться об интеграции API в свое приложение.

«Сегодня основной проблемой, остающейся в проектах NLP, является производственная сторона», – сказал VentureBeat по электронной почте технический директор и основатель NLP Cloud Жюльен Салинас. Новые модели НЛП позволяют большему количеству разработчиков экспериментировать с включением языковых возможностей в свои проекты.

Возможные варианты использования включают сканирование веб-страниц и другого неструктурированного текста и извлечение именных сущностей в рамках генерации лидов перед проведением анализа настроений по заявкам в службу поддержки и их сортировкой по срочности. Контент-маркетологи могут использовать платформу для обобщения текста и создания заголовков.

Для правильного развертывания и запуска моделей искусственного интеллекта в производственной среде требуются сильные возможности DevOps, программирования и искусственного интеллекта. Немногие разработчики овладели всеми тремя дисциплинами, особенно в небольших компаниях. У команды могут быть знания в области науки о данных, но не возможности DevOps, или инженеры-программисты, которым необходимо развернуть NLP, не нанимая команду по анализу данных.

Компания сосредоточена на упрощении развертывания лучших доступных моделей с открытым исходным кодом, а не на разработке собственных моделей. Это позволяет ему сосредоточиться на улучшении опыта разработчика, а не на настройке базовых моделей. Салинас сказал, что компания выбрала Hugging Face и spaCy за их сильные стороны.

По словам Салинаса, трансформеры Hugging Face более совершенные и точные, чем spaCy. Hugging Face также создает огромный репозиторий с открытым исходным кодом для моделей НЛП, что делает выбор лучшей модели для данного варианта использования более удобным.

SpaCy быстрее и менее ресурсоемко, чем другие библиотеки NLP. Библиотека существует дольше и недавно добавила возможность поддержки моделей на основе трансформаторов.

В будущем Салинас планирует добавить диалоговые модели для чат-ботов, новые модели реферирования, которые могут обрабатывать большие фрагменты текста, и модели генерации текста. Он также надеется, что со временем будет поддерживать больше языков, но считает, что неанглийские модели все еще нуждаются в доработке.

С момента своего запуска три месяца назад NLP Cloud быстро растет. В настоящее время у него около 500 пользователей, 30 из них – платные. Хотя большинство пользователей являются стартапами, компания начала видеть более крупных клиентов.