Корпоративный ИИ: от «покупки большего количества GPU» к «оптимальной конфигурации для снижения затрат на вывод»… Решения AMD и Red Hat привлекают большое внимание

robot
Генерация тезисов в процессе

Компании внедряют искусственный интеллект, переходя через новую водораздел. Сегодня рынок сосредоточен не только на инвестициях в ИИ, но и на том, как развернуть подходящие полупроводники и инфраструктуру для различных бизнес-задач, чтобы максимально повысить эффективность затрат. Особенно с быстрым ростом задач «агентского ИИ» и увеличением стоимости вычислений для рассуждений, для крупных предприятий ключевым вопросом стало не слепое выбор самых мощных устройств, а подбор подходящих вычислительных ресурсов в соответствии с целями, то есть «выбор».

На фоне этих изменений снова привлекает внимание сотрудничество AMD и Red Hat. Вице-президент по корпоративным технологиям AMD Джон Хэмптон на конференции «Red Hat Summit 2026», проходившей в Бостоне, отметил, что компании хотят получить более гибкую инфраструктуру ИИ в рамках гибридной среды. Он упомянул, что недавно многие клиенты спешно создавали крупные GPU-кластеры для удовлетворения потребностей ИИ, но на практике сталкивались с значительно превышающими ожидания затратами.

Стоимость рассуждений ИИ резко выросла… компании пересматривают стратегию единого крупного GPU

По словам Хэмптона, многие компании, чтобы не отставать в начальной борьбе за ИИ, сосредоточились на массовых закупках высокопроизводительных GPU. Проблема в том, что по мере расширения масштабов услуг, стоимость каждого запроса ИИ постоянно накапливается, быстро увеличивая бюджетное давление. В индустрии этот феномен называют «Token economics», что означает, что с ростом использования генеративного ИИ, стоимость обработки токенов также увеличивается, напрямую влияя на прибыльность компаний.

Он отметил: «Компании изначально закупали крупные GPU-кластеры для ИИ, чтобы не отставать, но сейчас сталкиваются с непосильной реакцией. Хотя применение ИИ растет, чрезмерное ускорение затрат вызывает серьезные опасения». Это в конечном итоге означает, что ядро стратегии ИИ компаний меняется с «обеспечения максимальной производительности устройств» на «оптимизированное развертывание по задачам».

AMD и Red Hat: предоставление решений «всего спектра» — от CPU до GPU

В ответ на эти тенденции AMD выпустила продуктовую линейку «всего спектра», включающую CPU, недорогие GPU и высокопроизводительные ускорители. Их стратегия — объединить эти аппаратные средства с открытым программным стеком Red Hat, чтобы поддерживать гибкое управление задачами ИИ в гибридных облачных средах без зависимости от конкретных поставщиков.

Например, AMD Instinct MI350P — это GPU на базе PCIe, который относительно легко интегрировать в существующие серверы. Он отличается воздушным охлаждением для повышения эффективности затрат. Red Hat AI выступает как платформа для предприятий, поддерживающая развертывание и расширение ИИ-агентов на таких устройствах. Кроме того, с помощью процессоров AMD EPYC и инструментов виртуализации Red Hat можно осуществлять интеграцию серверов, что помогает снизить занимаемое пространство и энергопотребление дата-центров.

Ключ в «открытой архитектуре»… одновременное управление бюджетом ИИ и модернизация инфраструктуры

Основная идея — «открытость» и «выбор». Вместе с Red Hat AMD подчеркивает, что по сравнению с закрытыми экосистемами, компании должны использовать открытую архитектуру, чтобы выбирать наиболее подходящие ресурсы для различных задач ИИ — от CPU, низкоэнергетичных GPU до высокопроизводительных ускорителей. Не все задачи рассуждения требуют развертывания на дорогих устройствах.

Преимущества такого подхода не ограничиваются снижением затрат. Для компаний это означает возможность максимально использовать существующую инфраструктуру, не замедляя внедрение ИИ, а также перераспределять сэкономленные бюджеты и электроэнергию на новые проекты ИИ. Это имеет важное практическое значение, позволяя одновременно модернизировать инфраструктуру ИИ и контролировать расходы.

Хэмптон прогнозирует, что в будущем критерии оценки рынка ИИ скорее всего перестанут быть «что купили», а станут «как развернули». По мере того, как борьба за ИИ перейдет в операционный режим, аналитики считают, что успех будет зависеть не только от производительности, но и от умения тонко балансировать между общей стоимостью владения и реальными результатами.

TP AI Предупреждение: Эта статья основана на модели языка TokenPost.ai и является кратким изложением. Основная информация могла быть упущена или не соответствовать действительности.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить