Как корпоративный ИИ меняет требования к серверной инфраструктуре

Как корпоративный ИИ меняет требования к серверной инфраструктуре
Источник: Fplus
Российский рынок корпоративного искусственного интеллекта постепенно переходит от экспериментов к массовому внедрению. По данным исследований, больше половины отечественных компаний уже внедрили генеративный ИИ как минимум в одну функцию организации. На примере сервера «Спутник ИИ» производителя электроники Fplus разберемся, какие тренды формируют новый облик серверной инфраструктуры и почему компании отказываются от точечных решений в пользу масштабируемых платформ.

От экспериментов к надежным решениям

Сервер «Спутник ИИ» целенаправленно проектировался как промышленное решение, способное работать с гарантированной производительностью и ориентированное на запуск нейросетей, а не как экспериментальный стенд.

Если первая волна внедрения ИИ была во многом связана с пилотными проектами, с помощью которых компании тестировали возможности нейросетей на ограниченных выборках данных без предъявления серьезных требований к аппаратной составляющей, то теперь ситуация изменилась.

Бизнес активно внедряет искусственный интеллект в различные бизнес-процессы. Типичный пример – автоматизация документооборота крупного промышленного предприятия. Система анализирует все документы компании, классифицирует их на конструкторскую, юридическую и бухгалтерскую документацию, создает структурированную базу. Бухгалтеры и юристы через CRM-систему загружают документ и через 5-7 секунд получают готовый отчет, который автоматически попадает в рабочий процесс.

Поэтому экспериментальные решения уже не отвечают интересам заказчиков. Имеет значение не только, какой программный продукт работает с нейросетью, но и оборудование, на котором развернута система. Аппаратные мощности должны быть высокопроизводительными и надежными.

Универсальность против специализации

При проектировании сервера инженеры Fplus уделили внимание созданию гибкой конфигурации. «Спутник ИИ» совместим с ускорителями разных производителей (NVIDIA, AMD, Intel и потенциально с китайскими и отечественными решениями), а также может работать с любыми видами нейросетей.

«Спутник ИИ» совместим с ускорителями разных производителей
«Спутник ИИ» совместим с ускорителями разных производителей
Источник: Fplus

Такая универсальность не случайна. За последние два года спектр применения решений на базе ИИ значительно расширился. Так, ритейл использует нейросети для анализа продаж, изучения конкурентов и прогнозирования рыночных трендов. ML-модели могут обрабатывать данные, строить графики, а при обнаружении аномалий — например, резкого роста спроса на электросамокаты — самостоятельно проанализировать сегмент и выяснить причины.

В финтехе ИИ помогает автоматизировать принятие инвестиционных решений, проводить анализ транзакций, выявлять финансовые преступления и случаи мошенничества. В промышленности — повышать эффективность работы оборудования и анализировать действия сотрудников, чтобы минимизировать риски аварий и несчастных случаев на производстве.

Сегодня в открытом доступе находится более 1,8 млн различных нейросетей, предназначенных для совершенно разных задач, но все они достаточно требовательны к аппаратной базе. На обычном ПК, даже с мощной игровой видеокартой, подобную систему не развернуть. Не подойдут и узкоспециализированную решения. Для таких задач нужно оборудование, совместимое с разными графическими ускорителями.

«Платформа позволяет построить работу с искусственным интеллектом исходя из специфических задач конкретного бизнеса. На сервере можно развернуть нейросеть для любых целей — от базовой автоматизации документооборота до сложных R&D-проектов, от работы с аудиоданными до видеоаналитики», – отметили в Fplus.

На сервере можно развернуть нейросеть для любых целей — от базовой автоматизации документооборота до сложных R&D-проектов
На сервере можно развернуть нейросеть для любых целей — от базовой автоматизации документооборота до сложных R&D-проектов
Источник: Fplus

Поэтапное масштабирование как новая экономическая модель

В сервере «Спутник ИИ» реализован принцип модульного роста. Модель имеет 8 слотов для видеокарт, однако заказчик может начать с малого: установить две A40 и постепенно добавлять ускорители по мере роста задач и бюджета. При этом не требуется замена материнской платы, блоков питания или системы охлаждения — все компоненты изначально рассчитаны на максимальную конфигурацию.

Такая архитектура отражает новую экономическую модель рынка ИИ-инфраструктуры. Теперь компании начинают с базовых задач видеоаналитики (до 5 Гб памяти на ускоритель), переходят к обработке данных начального уровня (до 48 Гб), затем к дообучению больших языковых моделей (80 Гб), а наиболее продвинутые реализуют масштабные проекты вроде создания цифровых двойников.

Сервер имеет восемь слотов для видеокарт
Сервер имеет восемь слотов для видеокарт
Источник: Fplus

Экономическая ситуация заставляет заказчиков пересмотреть подходы к инвестициям в ИИ-инфраструктуру. Вместо больших единовременных трат бизнес предпочитает поэтапное наращивание мощностей — начать с минимальной конфигурации и расти по мере увеличения потребностей и появления бюджета.

Покупка отдельных серверов под каждую задачу приводит к неоправданным расходам. «Заказчик может подумать, что ему не нужен четырехюнитовый сервер. Он может купить более доступный двухюнитовый и поставить в него 2 видеокарты. Но это будет стратегическая ошибка. При масштабировании инфраструктуры ему придется купить еще один сервер, чтобы поставить еще 2 карты. Так будет расти парк оборудования и объем расходов на обслуживание», — объясняют в Fplus.

Собственные данные как источник конкурентного преимущества

«Спутник ИИ» позволяет запускать нейросети локально. То есть модели будут обрабатывать корпоративные данные без выхода в Интернет, что исключает риски утечки информации.

Сервер Fplus «Спутник ИИ» позволяет локально запускать нейросети
Сервер Fplus «Спутник ИИ» позволяет локально запускать нейросети
Источник: Fplus

Это решение отражает два заметных тренда корпоративного искусственного интеллекта. С одной стороны, растет понимание, что настоящее конкурентное преимущество дает не использование готовых нейросетей общего назначения, а дообучение на собственных данных. Компании хотят создавать ИИ-решения, которые учитывают специфику их бизнес-процессов.

«Чтобы нейросеть давала корректные ответы и не галлюцинировала, ее дообучают. Фактически модель становится предметно-ориентированной. Например, она может быть нацелена только на поиск и анализ конструкторской документации. В этом случае система будет выдавать правильные ответы», – подчеркивают в Fplus.

Процесс внутрикорпоративного дообучения состоит из нескольких этапов.

  • Этап 1. Подготовка данных (60-70 % времени проекта).

Специалисты собирают корпоративные данные и систематизируют их. Например, если компания хочет обучить нейросеть анализировать техническую документацию, то материалы нужно разложить по папкам: документы по одному типу металлоконструкций — в одну папку, по другому типу — в другую.

  • Этап 2. Разметка данных (10-15 % времени).

Экспертам необходимо указать нейросети правильные и неправильные примеры — фактически объяснить, что считать корректным результатом, а что ошибкой. Этот этап критически важен для качества будущей модели.

  • Этап 3. Непосредственное обучение (24-72 часа).

Подготовленные данные «прогоняют» через нейросеть. Сам процесс вычислений занимает в среднем около суток, но может потребовать нескольких итераций, если результаты содержат неточности.

  • Этап 4. Валидация и корректировка.

Эксперты проверяют качество обученной модели на новых данных. При необходимости процесс повторяется с корректировкой параметров.

Весь цикл дообучения требует значительных вычислительных ресурсов и стабильной работы оборудования в течение длительного времени, что делает критически важным выбор надежной серверной платформы.

Планирование на перспективу

Рынок корпоративного ИИ развивается в условиях быстрой смены технологических поколений. Эта скорость становится особенно заметна, когда мы говорим о графических процессорах. Компании вынуждены балансировать между необходимостью инвестировать в современные решения и рисками устаревания оборудования.

Текущая конфигурация на базе процессоров Intel третьего поколения сохранит актуальность в течение нескольких лет. «В среднесрочной перспективе мы ждем, что на рынке появятся более мощные видеокарты — NVIDIA B200, которым потребуются процессоры пятого, а лучше шестого поколения», — поясняют в Fplus.

Это создает окно возможностей для планирования инвестиций. Компании, которые сегодня выбирают платформы с оптимальным соотношением производительности и цены, смогут эффективно использовать их до момента появления принципиально новых технологий.

Подход к обновлению инфраструктуры также меняется: вместо попыток «угадать» будущие потребности, бизнес фокусируется на максимально эффективном использовании текущих технологий. «Ко времени появления B200 мы предложим обновленную платформу. Так бизнес получит максимальную отдачу от каждого цикла инвестиций, не переплачивая за технологии», — говорят в Fplus.

Российский рынок корпоративного ИИ находится на этапе перехода от экспериментального использования к промышленному внедрению. Этот процесс требует от компаний новых подходов к планированию ИТ-инфраструктуры – более гибких и рассчитанных на долгосрочную перспективу.

Тематики: Интеграция, Оборудование

Ключевые слова: сервер, серверное оборудование, серверное, ИТ инфраструктура, Искусственный интеллект, Fplus