Ольга Ведерникова - Выпускник МИФИ, инициатор проекта Epsilon Workspace (Университетский технологический акселератор МИФИ и «Росатома»). Как должен выглядеть продвинутый современный информационный продукт, помогающий бизнесу с обработкой информации, включая анализ больших данных? Насколько автономными от человека и «умными» могут быть такие информационные системы?
Можно ли пользоваться ими, ничего не понимая в программировании?Как должен выглядеть современный бизнес-ассистент Мы с супругом всю жизнь проработали в IT и Data Science подразделениях разных корпораций, все время сталкиваясь с задачами, внутри которых обязательно была часть, связанная с анализом данных. Сначала это были обычные данные и реляционные модели, чему нас учили в институте. Затем стали появляться большие данные и задачки по их обработке, анализу и предиктивной аналитике. У нас появилось понимание, какие продукты и инструменты нужны для того, чтобы собирать и обрабатывать, большие данные. А дальше появились технологии, связанные с искусственным интеллектом (ИИ), и благодаря ним стало возможным собирать, обрабатывать и анализировать большие данные без программистов. Я уверена: современный продукт для бизнеса по обработке данных должен выглядеть для пользователя как совокупность визуальных элементов, каждый из которых отвечает за ту или иную операцию над данными, например: объединение, фильтрация, сортировка, извлечение, удаление дубликатов и так далее, начиная с самых таких простых операций и заканчивая довольно сложными, как, например, модели машинного обучения, которые могут на основании этих данных сделать прогноз, или какие-то выводы, или даже дать рекомендацию. И все задачи по анализу данных решаются через выстраивания визуальных элементов, то есть вы просто «дергаете» курсором разные кубики на экране, связываете их между собой и на каждом этапе видите промежуточный результат. Из этих «кубиков» можно конструировать ИИ-агентов, ассистентов, помогающих в бизнесе. Очень важно, что это No-Сode-системы, то есть не требующие знания кодинга и программирования. Агенты бывают разные Уже определились типовые роли ИИ-агентов. Первый тип — это агенты, которые очень хорошо умеют работать с неструктурированной информацией, например, разбросанной по разным местам документов, многостраничных таблиц, диаграмм и так далее. То есть они умеют проанализировать документ и вытащить из него всё самое ценное. Новые поколения информационных систем имеют преимущества перед решениями предыдущих лет, которые, как правило, не умеют работать с таблицами и диаграммами, очень плохо понимают, что там написано, что к чему относится, особенно если диаграммы ещё разного цвета. Решения новых поколений могут понять диаграмму, даже если на ней нет подписи данных и где-то внизу есть легенда, а смысл столбцов диаграммы надо понимать по их цвету. Современные большие визуальные модели — visual models — в состоянии все это делать. Это очень часто востребовано со стороны компаний, у которых много инженерно-технической документации, а также у аудиторов и консультантов, которые вынуждены работать с большим количеством разных неструктурированных и сложных документов. Агенты второго типа могут распознать документ и понять, в какие таблички извлеченные данные надо разложить, чтобы с ними можно было потом работать, и потом на основании их сделать уже какую-то рекомендацию или провести анализ. То есть такой агент не просто вытаскивает что-то из PDF-файлов, он еще это все раскладывает по нужным местам и дает на выходе какой-то осмысленный аналитический результат. Насколько хватает фантазии Список функций, которые может выполнять современная система обработки данных, не закрытый, потому что искусственный интеллект может помочь пользователю автоматизировать самые разные операции, начиная с каких-то простых вычислений, с подготовки отчетов, с написания писем и заканчивая предикативными моделями, а также моделированием или эмуляцией технологических процессов, вплоть до выработки предложений по химическому составу лекарств в фармацевтической промышленности. Перечень возможных отраслевых задач, которые можно поручить такой системе, в принципе ограничен только фантазией пользователя и количеством данных, которые он может «скормить» системе. Конечно, обучение системы на большом массиве данных — это способ хороший, но очень дорогой, недоступный для большинства компаний, кроме крупнейших, обладающих большой инфраструктурой, вычислительными мощностями и средствами на то, чтобы приобретать сеты с данными. Еще 5 лет назад я бы сказала, что маленькие компании — это абсолютно нецелевая аудитория для систем с ИИ. Но сейчас именно маленькие компании интересуются ими даже больше, чем средний бизнес, потому что у ИИ-агентов появилась возможность выполнять функции, которые раньше были им недоступны, например им стал доступен веб-скрейпинг, то есть агент может «бегать» по разным сайтам и оттуда вытаскивать то, что ты ему напишешь в промте, он может проводить бизнес-аналитику и оценку рынка работы с определенным партнером. Кроме того, для малых и средних компаний возможно обучение системы на внутрикорпоративных данных — регламентах, инструкциях, справочных материалах, данных, накопившихся в ходе производственных процессов. Этот метод обучения называется методом дополненной генерации. Благодаря ему система может оказывать помощь в сфере внутренних процессов компании. Поговорим? Появление больших языковых моделей и их подключение к системам обработки данных породило возможность появления ИИ-агентов, которые собирают и обрабатывают информацию и при этом общаются с пользователем на естественном языке. Очень важный тип ИИ-агента — агенты-консультанты, работающие в режиме вопрос-ответ. Главное отличие такого агента — он понимает, что ты у него спрашиваешь. Например, у него можно спросить: а что с моим счетом по такому-то договору, почему вы до сих пор его не оплатили? И агент может не только распознать этот текст, но и понять контекст, понять, о каком конкретно договоре идет речь, и при необходимости задать уточняющий вопрос. И это все делает искусственный интеллект, без участия не только людей, но и скриптов. Он сам решает, в какую базу данных ему нужно залезть, в какие источники нужно посмотреть, после чего генерирует ответ в формате разговорной речи. Не забывать о человеке И еще надо упомянуть об одном обязательном требовании к современным бизнес-системам — Human-on-the-loop, возможности предоставления людьми обратной связи системе искусственного интеллекта. Обязательно должна быть предусмотрена возможность проверки результатов работы ИИ человеком. Из этого следует еще одно обязательное свойство современной системы: observability, то есть прозрачность того, что делает система, чтобы она не превращалась для людей в «черный ящик».
Свежие комментарии