В статье рассмотрены особенности построения высокопроизводительных систем на основе ПЛИС последнего поколения. Подробно раскрыты вопросы организации архитектуры комплекса, позволяющей заметно превосходить отечественные и зарубежные аналоги, а также существенно расширить спектр решаемых задач.
Задача построения суперкомпьютеров с каждым днём приобретает всё большую актуальность и становится приоритетной в передовых разработках науки и техники, что вызвано растущим спросом на высокопроизводительные вычисления со стороны коммерческих, государственных и научных организаций.
Ключевой тенденцией в решении важнейших научно-технических задач становится непрерывное увеличение производительности вычислительных комплексов. Производительность однопроцессорных компьютеров практически достигла предела. Возможности дальнейшего роста производительности с помощью уменьшения технологических норм практически исчерпаны. Кроме того, при увеличении плотности размещения транзисторов на кристалле значительно возрастает сложность процессоров, поэтому прирост производительности не пропорционален затрачиваемым аппаратным ресурсам и энергии. Не помогает дальнейшее наращивание объёмов кэш-памяти микропроцессоров, а также числа одновременно выполняемых команд. Заявленные производителями пиковые характеристики процессоров практически недостижимы без низкоуровневого программирования. Большинство трудоёмких вычислительных задач выполняется на массовых микропроцессорах с низкой эффективностью, составляющей не более 10–20% [1]. Если десять лет назад компьютерному сообществу казалось, что вычислительная техника может неограниченно развиваться, совершенствуя микропроцессорные схемотехнические и технологические решения, то сейчас ясно, что без кардинальной перестройки архитектуры вычислительной техники сохранить темп роста её производительности невозможно.
Одним из способов повышения производительности вычислительных систем является распараллеливание вычислительных процессов. В то же время реальная производительность многопроцессорных вычислительных систем, которые ориентированы на традиционные методы организации параллельных вычислений и представляют собой механически соединённые традиционные микропроцессоры, зачастую не превышает 10–15% от заявленной пиковой производительности вследствие необходимости реализации множества процедур межпроцессорного обмена, а также синхронизации последовательных процессов, выполняемых в процессорах системы [2]. Основная причина этого – несоответствие между жёсткой архитектурой вычислительной системы (ВС) и информационной структурой решаемых задач, из-за чего существующие суперкомпьютеры и работают столь неэффективно. Данный недостаток позволяет устранить способ построения ВС с гибкой, динамически перестраиваемой (программируемой) архитектурой [3], подстраиваемой под информационную структуру конкретной задачи. Практическое внедрение данной концепции сдерживалось отсутствием необходимой для её реализации реконфигурируемой элементной базы. В последние годы такая элементная база на рынке появилась – это программируемые логические интегральные схемы (ПЛИС) высокой степени интеграции. На основе ПЛИС возможно без привлечения больших финансовых затрат создавать высокопроизводительные вычислительные системы с программируемой архитектурой, существенно опережающие существующие аналоги по многим ключевым характеристикам.
По этому пути уже идут ведущие мировые производители. В то же время западные и отечественные производители используют ПЛИС, как правило, только в качестве сопроцессоров к стандартным вычислительным узлам – универсальным микропроцессорам. Концепция же построения ВС с программируемой архитектурой предполагает использовать ПЛИС в качестве базы для создания реконфигурируемых вычислительных систем, адаптируемых к структуре решаемой задачи. В качестве основного вычислительного элемента используются вычислительные структуры, созданные в поле логических блоков ПЛИС, в то время как небольшое количество универсальных микропроцессоров выполняют вспомогательные функции: загрузку конфигураций ПЛИС, обмен данными, управление, тестирование, загрузку исходных данных, визуализацию результатов и т.п.
Высокопроизводительные вычислительные системы (ВВС) на основе ПЛИС предназначены для решения задач, требующих обработки сверхбольших информационных массивов и потоков. Современная тенденция к высокой плотности вычислений предъявляет особые требования к архитектуре построения ВВС и акцентирует внимание на достижении максимальной производительности при таких конструктивных ограничениях, как габариты, потребляемая мощность и тепловыделение. Имеющиеся на сегодняшний день вычислители на базе ПЛИС в основном узко ориентированы на решение задач обработки по одному и тому же алгоритму большого количества наборов входных данных и до недавнего времени заметно уступали там, где требовались вычисления, связанные с высокоскоростной передачей данных как между элементами ВВС, так и при взаимодействии ВВС с другими элементами кластера.
В подавляющем большинстве случаев кластеры на основе ПЛИС применяются для решения математических задач (в том числе задач криптографии и обеспечения информационной безопасности), при этом решения по объединению всех вычислительных блоков в единое вычислительное пространство заказчик принимает самостоятельно. Такой вариант вполне допустим для типовых задач. Однако круг задач, реализуемых на кластерах такого рода, значительно шире. Требования, предъявляемые к подобным системам их заказчиками, диктуют необходимость более специфического функционала, организации гораздо более сложного взаимодействия между узлами кластера, имеются существенные требования к пропускной способности каналов передачи данных. Этот список может быть расширен, однако уже на данном этапе становится ясно, что архитектурные и конструктивные требования заказчиков таковы, что элементы ВВС должны обладать значительно улучшенными функциональными характеристиками и давать возможность построения кластеров любых типов, в том числе и в зависимости от решаемой задачи.
В процессе построения любых программных систем решения о функциональных возможностях и структуре отдельных компонентов следует принимать после того, как будет разработана общая архитектура системы. Этот тезис верен в том числе и тогда, когда речь идёт о написании программного продукта для высокопроизводительных кластеров на основе ПЛИС. Наряду с написанием конфигурационных файлов ПЛИС существует необходимость в обеспечении совместного функционирования всех вычислительных модулей кластера, координации и диспетчеризации вычислительного процесса.
Современные ПЛИС потенциально обладают широкими возможностями для применения в качестве основных элементов ВВС [4]. При этом главным препятствием к их использованию остаётся фактическое отсутствие адекватной архитектуры вычислителя (совокупности вычислителей – кластер), позволившей бы наиболее широко применить все потенциальные возможности.
Учитывая широкий класс задач, требующих новых подходов к высокопроизводительным вычислениям, на основе изложенных принципов перед разработчиками компании FASTWEL была поставлена задача создания вычислителя нового поколения БВР-01 (рис. 1).
Вычислитель ориентирован на решение задач, требующих интенсивной обработки данных, применения методов линейной алгебры, цифровой обработки сигналов, математической физики, символьной обработки и рассчитан на использование во многих встраиваемых системах, в том числе в системах военного назначения, системах обеспечения информационной безопасности, мобильных системах транспорта. Главные его особенности – возможность гибкого конфигурирования собственной структуры и возможность объединения с другими аналогичными устройствами для создания кластерных структур.
БВР-01 представляет собой законченный блок в виде 19" конструктива высотой 1U с управляющим компьютером (УК) CPC1301 компании FASTWEL, выполненным на базе процессора Intel Core 2 Duo, и c восемью ПЛИС Xilinx Virtex-6, соединёнными между собой современным высокоскоростным интерфейсом PCI Express Gen 2.0. На БВР-01 могут устанавливаться любые ПЛИС из семейства Xilinx Virtex-6: LX240, LX365, LX550, SX315 или SX475 (табл. 1). Модуль памяти EM-DDR3-2GB позволяет использовать память DDR3 ёмкостью 2 Гбайт на ПЛИС.
На задней панели блока расположены разъёмы внешних интерфейсов (рис. 2).
Электропитание подаётся в БВР-01 через разъём питания, находящийся на задней панели. Подаваемое напряжения преобразуется до требуемого номинала интегрированными в устройство DC/DC-конверторами собственной разработки. Обеспечивается рабочий ток более 100 А по номиналу 1 В на пару ПЛИС, что допускает использование в БВР-01 самых больших и энергоёмких кристаллов ПЛИС семейства Virtex-6.
Структурная схема БВР-01 приведена на рис. 3.
Для реализации PCI Express в БВР-01 предусмотрен коммутатор PEX8648, с помощью которого каждая из восьми ПЛИС связана друг с другом и с УК, что позволяет передавать данные по шине PCI Express Gen 2.0 с суммарной пропускной способностью на уровне 20 Гбит/с. Внешний порт PCI Express позволяет каскадировать БВР-01 с использованием медных или оптических кабелей.
Мониторинг, диагностика, контроль данных о напряжении и температуре кристаллов ПЛИС, управление питанием БВР-01 производятся с использованием специально для этого разработанного модуля диагностики (МД), который имеет отдельный сетевой выход Fast Ethernet и реализован с использованием Web-интерфейса.
Габаритные размеры БВР-01 составляют 44×482×650 мм (В×Ш×Г), вес 25 кг.
В целом БВР-01 представляет собой современный, легко масштабируемый вычислитель на базе реконфигурируемых элементов ПЛИС Xilinx Virtex-6 (LX240, LX365, LX550, SX315 или SX475) и с общим энергопотреблением менее 800 Вт.
В основу его разработки положено объединение следующих составляющих:
Блок вычислительный реконфигурируемый (БВР-01) объединяет в себе 4 ВЭ, УК, плату-носитель, МД и является базовым элементом построения кластера. В БВР-01 реализованы такие принципы, как:
Индустрия суперкомпьютеров за последние годы прошла огромный путь и нашла своё место в решении широкого круга задач. В то же время требования к современным вычислительным системам всё возрастают и толкают производителей, с одной стороны, к конструированию узкоспециализированных решений, ориентированных на конкретные классы задач, а с другой – к поиску универсальных и наиболее эффективных решений.
Благодаря использованию уникальных технических и программных решений, а также высокоскоростных интерфейсов передачи данных БВР-01 в полной мере удовлетворяет требованиям, предъявляемым к современным универсальным высокопроизводительным вычислителям, позволяя создавать на своей основе ПЛИС-суперкомпьютеры, превосходящие по технико-экономическим характеристикам ВВС с другой архитектурой в сегменте рынка суперЭВМ и предоставляя все основания для применения во встраиваемых системах военного назначения, требующих высокоскоростной обработки сверхбольших объёмов информации. Этот вывод подтверждается успешными результатами первых внедрений представленного в статье изделия. ●
Автор – сотрудник фирмы FASTWEL
Телефон: (495) 234-0639
E-mail: info@fastwel.ru
Экономика профилактики: использование Интернета вещей для планирования профилактического обслуживания оборудования
Машины, а точнее, сложные высокотехнологичные установки – станки или другое технологическое оборудование для любой промышленной отрасли представляют собой ценные активы, которые необходимо защищать от повреждений, неисправностей и отказов с помощью надлежащих мер по техническому обслуживанию. В этой статье будет рассмотрен один из примеров создания системы, автоматически контролирующей состояние и время работы машин с последующей отправкой уведомлений о графике профилактического технического обслуживания (ПТО). 23.04.2024 СТА №2/2024 417 0 0Блок управления для исполнительных устройств в оптическом тракте лазерной системы
В статье представлен блок управления для исполнительных устройств в оптическом тракте лазерной системы. Приведены решения на аппаратном и программном уровнях, обоснован выбор средств автоматизации. 23.04.2024 СТА №2/2024 326 0 0Построение цифрового двойника склада металлопроката с использованием искусственной нейронной сети
Изложены методика и результаты эксперимента по применению искусственной нейронной сети для отслеживания перемещений продукции металлопроката на территории цеха. Приведены преимущества такого способа организации цифрового двойника склада. 23.04.2024 СТА №2/2024 295 0 0Горячее резервирование с MasterSCADA 4D и ПЛК Regul R500 на примере АСУ ТП для авиатопливных комплексов
В статье представлено решение для автоматизированного контроля и управления технологическими объектами склада одного из технологических лидеров российской авиатопливной отрасли. Система построена на базе ПЛК REGUL500 с поддержкой горячего резервирования центральных процессоров и программной платформе MasterSCADA 4D с поддержкой резервирования серверов, работы рантайм на операционной системе Astra Linux и синхронизацией данных на программном уровне. Эти составляющие, а также опыт сертифицированного интегратора ООО «ЛИТЭК», позволили создать отказоустойчивую систему управления повышенной надёжности в полном соответствии с современными требованиями стратегии цифровой трансформации. 23.04.2024 СТА №2/2024 428 0 0