Модульная архитектура HPE Superdome Flex: как она работает и почему это важно

Как и большинство поставщиков серверов x86, HPE в своих серверах последнего поколения, включая HPE Superdome Flex, использует новейшие процессоры семейства Intel Xeon Scalable с кодовым названием Skylake. В эталонной архитектуре Intel для этих процессоров используется новая технология UltraPath Interconnect (UPI) с ограничением масштабирования до восьми сокетов. Большинство поставщиков, которые используют эти процессоры, применяют в серверах способ соединения без склеивания, однако в HPE Superdome Flex используется уникальная модульная архитектура с возможностями масштабирования, превышающими возможности Intel: от 4 до 32 сокетов в одной системе.

Эта архитектура используется потому, что наметилась потребность в платформах с масштабированием, выходящим за пределы восьми сокетов Intel, особенно актуально это сегодня, когда объемы данных увеличиваются с невиданной скоростью. Кроме того, поскольку Intel разрабатывал UPI прежде всего для серверов с двумя и четырьмя сокетами, серверы с восемью сокетами без склеивания сталкиваются с проблемами пропускной способности. Архитектура HPE Superdome Flex обеспечивает высокую пропускную способность даже при росте системы до максимальной конфигурации.

Модульная архитектура HPE Superdome Flex основана на шасси с четырьмя сокетами с возможностью масштабирования до восьми шасси и 32 сокетов в одной серверной системе. Для использования в сервере доступен широкий выбор процессоров: от недорогих моделей Gold до топовой серии Platinum семейства процессоров Xeon Scalable.

Эта возможность выбора между процессорами Gold и Platinum во всем диапазоне масштабирования предоставляет отличные преимущества в соотношении цена/производительность по сравнению с системами начального уровня. Например, в типичной конфигурации с 6 ТБ памяти Superdome Flex обеспечивает более дешевое и более производительное решение, чем конкурентные предложения с четырьмя сокетами. Почему? Из-за особенностей архитектуры другие производители 4-процессорных систем вынуждены использовать модули памяти 128 ГБ DIMM и более дорогие процессоры с поддержкой 1.5 ТБ на сокет. Это значительно дороже чем использование модулей 64 ГБ DIMM в Superdome Flex с восемью сокетами. Благодаря этому платформа Superdome Flex с восемью сокетами и 6 ТБ памяти обеспечивает в два раза большую вычислительную мощность, в два раза большую пропускную способность памяти и в два раза большие возможности ввода-вывода, и она все равно будет более экономичной, чем конкурентные продукты с четырьмя сокетами и 6 ТБ памяти.

Аналогично, и для 8-процессорной конфигурации с 6 ТБ памяти, платформа Superdome Flex может предоставить менее дорогое и более производительное решение с восемью сокетами. Как? Другие производители 8-процессорных систем вынуждены использовать более дорогие процессоры Platinum, в то время, как Superdome Flex с восемью сокетами может использовать недорогие процессоры Gold, предоставляя такой же объем памяти.

Фактически, среди платформ на основе семейства процессоров Intel Xeon Scalable, только Superdome Flex может поддерживать более экономичные процессоры Gold в конфигурациях с 8 и более сокетами (архитектура Intel без склеивания поддерживает 8 сокетов только с дорогими процессорами Platinum). HPE также предлагает большой выбор процессоров с разным числом ядер, от 4 до 28 на процессор, позволяя соотнести их количество с требованиями к рабочим нагрузкам.

Возможность вертикального масштабирования в рамках одной системы, или scale up, предоставляет ряд преимуществ для критически важных нагрузок и баз данных, для которых лучше всего подходит HPE Superdome Flex. К ним относятся традиционные базы данных и базы данных в памяти, аналитика в реальном времени, ERP, CRM и другие транзакционные приложения. Для этих типов нагрузок проще и дешевле управлять одной вертикально масштабируемой средой, чем кластером с горизонтальным масштабированием; кроме того, это значительно снижает задержки и повышает производительность.

Высокие возможности масштабирования Superdome Flex достигаются благодаря уникальному чипсету HPE Superdome Flex ASIC, соединяющему отдельные 4-процессорные шасси. При этом все ASIC соединены между собой напрямую (с удаленностью в один шаг), обеспечивая минимальные задержки доступа к удаленным ресурсам и максимальную производительность. Технология HPE Superdome Flex ASIC обеспечивает адаптивную маршрутизацию для балансировки загрузки коммутационной матрицы и оптимизации задержек и пропускной способности, что повышает производительность и уровень доступности системы. ASIC объединяет шасси в кэш-когерентную фабрику-матрицу и поддерживает согласованность кэша во всех процессорах, используя для этого большой каталог с записями состояния строк кэша, который встроен непосредственно в ASIC. Такая схема когерентности играет важнейшую роль, обеспечивая для Superdome Flex способность поддерживать близкое к линейному масштабирование производительности в пределах от 4 до 32 сокетов. Типовые варианты архитектуры без склеивания демонстрируют уже более ограниченное масштабирование производительности (в пределах от четырех до восьми сокетов) из-за широковещательной рассылки служебных запросов для обеспечения когерентности.

Аналогично процессорным ресурсам может быть увеличен и объем памяти путем добавления шасси к системе. В каждом шасси имеется 48 слотов DDR4 DIMM в которые могут быть установлены модули памяти 32 ГБ RDIMM, 64 ГБ LRDIMM или 128 ГБ 3DS LRDIMM, что обеспечивает максимальный объем памяти 6 ТБ в шасси. Соответственно, общий объем оперативной памяти HPE Superdome Flex в максимальной конфигурации с 32 сокетами достигает 48 ТБ, что позволяет работать с самыми ресурсоемкими приложениями, использующими технологию in-memory.

Что касается ввода-вывода, каждое шасси Superdome Flex может быть оборудовано корзиной с 16 или 12 слотами ввода-вывода для обеспечения большого количества вариантов установки стандартных карт PCIe 3.0 и гибкой возможности поддержания системного баланса для любых рабочих нагрузок. В любом варианте корзины слоты ввода-вывода подключены к процессорам напрямую без применения шинных повторителей или расширителей, что могло бы увеличить время задержки или уменьшить пропускную способность. Это обеспечивает максимально возможную производительность каждой карты ввода-вывода.

Низкая задержка доступа ко всему пространству разделяемой оперативной памяти — это ключевой фактор высокой производительности Superdome Flex. Независимо от того, лежат ли данные в локальной памяти или в удаленной (в другом шасси), их копия может находиться в кэше разных процессоров в рамках системы. Механизм когерентности кэш-памяти обеспечивает согласованность кэшированных копий в случае, если процесс изменяет данные. Время задержки доступа процессора к локальной памяти составляет около 100 нс. Задержка доступа к данным в памяти другого процессора через канал UPI составляет около 130 нс. Процессоры, обращающиеся к данным, лежащим в памяти другого шасси, проходят путь между двумя Flex ASIC (всегда соединенным напрямую) с задержкой менее 400 нс, независимо от того, в каком шасси находится процессор. Благодаря этому Superdome Flex обеспечивает пропускную способность между двумя половинами матрицы (bi-sectioned) более 210 ГБ/с в конфигурации с 8 сокетами, более 425 ГБ/с в конфигурации с 16 сокетами и более 850 ГБ/с в конфигурации с 32 сокетами. Этого более чем достаточно для самых требовательных и ресурсоемких рабочих нагрузок.

 

 

 

Источник