Экстенсивное развитие нейросетевых технологий не может продолжаться бесконечно. Уже сегодня энергопотребление крупных дата-центров сопоставимо с энергопотреблением целых городов, а капиталовложения в инфраструктуру высокопроизводительной обработки данных, имеющие признаки кругового финансирования заинтересованных участников рынка, остаются низкоэффективными. При этом только две страны, США и Китай, могут продолжать гонку ИИ-технологий полного цикла.
Поэтому множество групп учёных по всему миру работает над возможными альтернативами как в части повышения эффективности алгоритмов машинного обучения и нейросетевых архитектур, так и программно-технических средств обработки данных. Вместе с этим отдельную ценность начинает представлять такое понятие как минимально достаточная нейросетевая инфраструктура для решения специфичных прикладных задач, например, обеспечения кибербезопасности, или более частная — выявление кибербуллинга в социальных сетях.
Технологии искусственного интеллекта основаны на синергии трёх основных компонентов — алгоритмов, данных и вычислительных мощностей. И если до недавнего времени математику нейросетевого анализа можно было назвать примитивной или даже отсутствующей, то с появлением новых подходов, например, использования вектора Шепли (Shapley Value) для интерпретации вклада отдельных факторов в прогнозы моделей машинного обучения или теоремы Колмогорова-Арнольда о представлении многомерных функций в нейросетевой архитектуре, с одной стороны — искусственный интеллект перестаёт быть «чёрным ящиком», и появляется целое отдельное направление объяснимого ИИ (Explainable Artificial Intelligence, XAI), с другой — расширяется пространство для работы учёных в области прикладной математики и математических проблем информатики.
При финансовой поддержке проекта Российского научного фонда № 25-71-10012, учёными из Российского технологического университета МИРЭА, Финансового университета и Центрального экономико-математического института Российской академии наук спроектирован и разработан программный комплекс (ПК) мультиагентной системы мониторинга цифрового пространства на основе созданного ранее гибридного нейросетевого трансформера KAN-BiLSTM (полный текст с описанием ИИ-модели опубликован в научном журнале Technologies).
ПК содержит модуль BiLSTM, модуль Transformer, многодоменную динамическую сеть внимания (Multi-Domain Dynamic Attention Network, MD-DAN), слой слияния признаков, модуль KAN (Kolmogorov-Arnold Network) и окончательный классификатор. Модуль на основе сетей Колмогорова-Арнольда (KAN-BiLSTM) позволяет дополнительно идентифицировать сложные зависимости между признаками и динамическим слиянием признаков домена, что улучшает общее качество классификации. Преимущества интеграции KAN заключаются в моделировании более сложных зависимостей между фокусами внимания и повышении качества прогнозов, особенно при наличии скрытых нелинейных связей в данных.
ПК способен обеспечивать эффективный мониторинг цифрового пространства и может быть использован в системах поддержки принятия решений, реализуя необходимость перехода от реверс-инжиниринга к российским технологиям полного цикла — от создания алгоритмов до индустриального внедрения.
Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных
Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных