Интерфейс PCI в компьютере: виды и назначение. Фото

PCI — Express (PCIe , PCI — E ) – последовательная, универсальная шина впервые обнародованная 22 июля 2002 года.

Является общей , объединяющей шиной для всех узлов системной платы, в которой соседствуют все подключённые к ней устройства. Пришла на замену устаревающей шине PCI и её вариации AGP , по причине возросших требований к пропускной способности шины и невозможности за разумные средства улучшить скоростные показатели последних.

Шина выступает как коммутатор , просто направляя сигнал из одной точки в другую не изменяя его. Это позволяет без явных потерь скорости, с минимальными изменениями и ошибками передать и получить сигнал.

Данные по шине идут симплексно (полный дуплекс), то есть одновременно в обе стороны с одинаковой скоростью, причём сигнал по линиям, течёт непрерывно , даже при отключении устройства (как постоянный ток, или битовый сигнал из нулей).

Синхронизация построена избыточным методом. То есть вместо 8 бит информации, передаётся 10 бит , два из которых являются служебными (20% ) и в определённой последовательности служат маячками для синхронизации тактовых генераторов или выявления ошибок . Поэтому, заявленная скорость для одной линии в 2.5 Гбитс , на самом деле равна примерно 2.0 Гбитс реальных.

Питание каждого устройства по шине, подбирается отдельно и регулируется с помощью технологии ASPM (Active State Power Management ). Она позволяет при простое (без подачи сигнала) устройства занижать его тактовый генератор и переводить шину в режим пониженного энергопотребления . Если сигнал не поступал в течение нескольких микросекунд, устройство считается неактивным и переводится в режим ожидания (время зависит от типа устройства).

Скоростные характеристики в двух направлениях PCI — Express 1.0 :*

1 x PCI —E ~ 500 Мбс

PCI —E ~ 2 Гбс

8 x PCI —E ~ 4 Гбс

16х PCI —E ~ 8 Гбс

32х PCI-E ~ 16 Гбс

*Скорость передачи данных в одном направлении в 2 раза ниже данных показателей

15 января 2007 года, PCI —SIG выпустила обновлённую спецификацию именуемую PCI-Express 2.0

Основным улучшением стала в 2 раза увеличенная скорость передачи данных (5.0 Ггц , против 2.5Ггц в старой версии). Усовершенствованию подвергся также двухточечный протокол передачи данных (точка-точка), доработана программная составляющая и добавлена система программного мониторинга за скоростью шины. При этом сохранилась совместимость с версиями протокола PCI —E 1.х

В новой версии стандарта (PCI — Express 3.0 ), главным нововведением будет измененная система кодирования и синхронизации . Вместо 10 битной системы (8 бит информации, 2 бита служебных), будет применяться 130 битная (128 бит информации, 2 бита служебных). Это позволит снизить потери в скорости с 20% до ~1.5% . Будет также переработан алгоритм синхронизации передатчика и приёмника, улучшен PLL (phase-locked loop). Скорость передачи увеличится предположительно в 2 раза (в сравнении с PCI —E 2.0 ), при этом сохранится совместимость с прошлыми версиями PCI —Express .

Алексей Борзенко ,
к.т.н., доцент РРТА

Интерфейс PCI Express (известный прежде под названием 3GIO) основан на открытых стандартах и выступает как наследник PCI и его вариантов для систем ввода-вывода серверов и клиентских устройств. В отличие от PCI и PCI-X, основанных на 32- и 64-разрядной параллельной шине, PCI Express использует высокоскоростную технологию последовательного соединения, похожую на ту, что используется в Gigabit Ethernet, Serial ATA (SATA) и Serial Attached SCSI (SAS). PCI Express отражает общую для компьютерной индустрии тенденцию замены устаревших параллельных общих шин на высокоскоростные последовательные соединения типа "точка-точка" (point-to-point).

Новая технология шины обеспечивает скорость передачи, которая будет достаточной с учетом развития процессоров и подсистем ввода-вывода, по крайней мере, в течение следующих 10 лет.

По сравнению с PCI технология PCI Express имеет следующие преимущества:

  • высокая пропускная способность - в первой версии теоретическая пиковая пропускная способность составит 5-80 Гбит/с, в зависимости от реализации;
  • последовательное соединение, обеспечивающее масштабирование производительности;
  • отдельное соединение "точка-точка" для каждого устройства вместо общей шины PCI;
  • малые задержки для серверной архитектуры;
  • меньший размер разъемов и упрощенное проектирование систем;
  • расширенные функции.

В течение следующего десятилетия интерфейс PCI Express постепенно заменит параллельные шины PCI, PCI-X и AGP. Сначала он вытеснит шины, которые требуют дополнительной производительности и функций. Например, первоначально PCI Express будет применяться как замена шины передачи графических данных AGP 8X в клиентских системах, обеспечивая высокую полосу пропускания и поддержку мультимедийного трафика. Он будет сосуществовать с шиной PCI-X и постепенно вытеснять ее в серверных системах.

Шина PCI

Шина PCI, появившаяся в 1992 г., стала основой системы ввода-вывода практически для всех компьютерных платформ. Первоначальная 33-МГц, 32-разрядная реализация обеспечивала теоретически возможную пиковую производительность 133 Мбайт/с. В последующие годы архитектура платформы развивалась, различные функции перекладывались на варианты PCI с более высокой пропускной способностью (табл. 1), включая AGP и PCI-X.

Таблица 1. Пропускная способность шин PCI, PCI-X и AGP

Шина и частота Пиковая пропускная способность, Мбайт/с
в 32-разрядном режиме в 64-разрядном режиме
PCI 33 МГц 133 266
PCI 66 МГц 266 532
PCI-X 100 МГц Не поддерживает 800
PCI-X 133 МГц Не поддерживает 1 Гбайт/с
AGP 8X 2,1 Гбайт/с Не поддерживает

Если внимательно изучить применяемую в PCI технологию передачи сигналов, станет ясно, что увеличить производительность этой многоточечной параллельной шины уже невозможно. Дело в том, что для шины PCI трудно реализовать наращивание частоты или уменьшение напряжения. Кроме того, она не поддерживает такие функции, как расширенное управление энергопотреблением, замена и подключение в горячем режиме периферийных устройств и функции качества сервиса - QoS (а проще говоря, доступности) для гарантированной полосы пропускания операций в реальном времени. Наконец, вся имеющаяся полоса пропускания шины PCI не поддерживает одновременную передачу данных в обоих направлениях. Многие сети передачи данных обеспечивают параллельный трафик, благодаря чему задержка при передаче сообщений сводится к минимуму.

Клиентские системы

Первый вариант шины PCI был разработан для поддержки 2D-графики, высокопроизводительных жестких дисков и локальных сетей. Вскоре после появления PCI выросшие требования к пропускной способности графической подсистемы 3D превысили возможности 32-разрядной шины PCI с частотой 33 МГц. Чтобы решить эту проблему, корпорация Intel (http://www.intel.com) вместе с несколькими производителями графических плат разработали спецификацию AGP, описывающую выделенную высокоскоростную шину для работы с графикой. Шина AGP освободила систему PCI от передачи графики, что позволило задействовать ее пропускную способность для других операций передачи данных и ввода-вывода. Кроме того, впоследствии Intel добавила выделенные каналы USB 2.0 и Serial ATA к южному мосту своих наборов микросхем (НМС), что дополнительно уменьшило нагрузку ввода-вывода на шину PCI. На рис. 1 показана внутренняя архитектура типичной клиентской системы ПК и пропускная способность шины ввода-вывода и графики.

Узкие места клиентских систем

Есть несколько шин клиентской системы, способных ограничивать производительность из-за постоянного совершенствования центрального процессора, памяти и устройств ввода-вывода: шина PCI, шина AGP и канал между северным и южным мостами.

PCI Bus. Шина PCI обеспечивает скорость передачи до 133 Мбайт/с для подключенных устройств ввода-вывода. Ряд устройств ввода-вывода способны загрузить значительную часть этой полосы пропускания, так что если подключить несколько таких устройств, то общая шина PCI не сможет справиться с трафиком.

На рис. 2 показаны требования к полосе пропускания разных сетевых протоколов, видеоприложений и внешних устройств, которые обслуживает шина PCI. Как видно, многоточечная общая шина PCI с трудом способна работать с современными устройствами. Проблема обостряется с появлением новых периферийных устройств, использующих еще более высокую скорость передачи.

Например, для Gigabit Ethernet нужна полоса пропускания 125 Мбайт/с, иными словами, этот сетевой протокол фактически полностью загружает шину PCI 133 Мбайт/с. У IEEE 1394b максимальная полоса пропускания составляет 100 Мбайт/с, и он также полностью загружает стандартную PCI-шину.

AGP. В последнее десятилетие требования к производительности видео удваивались каждые два года. За этот период шина передачи графики перешла от PCI к AGP, затем от AGP к AGP 2X, AGP 4X и, наконец, к сегодняшней AGP 8X.

AGP 8X работает на скорости 2,134 Гбайт/с. Несмотря на такую полосу пропускания, постепенный рост требований к производительности шины AGP создает значительные проблемы при проектировании плат и повышает стоимость соединений. Как и в случае шины PCI, расширение возможностей шины AGP становится все сложнее и дороже по мере роста частот.

Канал между северным и южным мостами. Нагрузка на шину PCI влияет и на связь между северным и южным мостами, особенно при использовании дисков SATA и устройств USB. В будущем здесь потребуется канал с большей полосой пропускания.

Серверные системы

В серверах первоначальная 32-разрядная, 33-МГц шина PCI была расширена до 64-разрядной 66-МГц с пропускной способностью 532 Мбайт/с. Частота 64-разрядной шины была увеличена до 100 и до 133 МГц - этот вариант называется PCI-X. Такая шина соединяет НМС серверной системы (или двухпроцессорной рабочей станции класса high-end) со слотами расширения, контроллерами Gigabit Ethernet и Ultra320 SCSI, интегрированными на системной плате. 64-разрядная шина PCI-X с частотой 133 МГц обеспечивает пиковую полосу пропускания 1 Гбайт/с между НМС системы и устройством ввода-вывода. Сейчас этого достаточно для большинства операций ввода-вывода, включая протоколы Gigabit Ethernet, Ultra320 SCSI и Fibre Channel 2 Гбит/с. Однако PCI-X, как и PCI, - это общая шина с присущими ей недостатками.

Группа PCI Special Interest Group (PCI SIG, http://www.psisig.com) разработала спецификацию PCI-X 2.0, описывающую 64-разрядную, 266-МГц шину PCI-X, у которой скорость передачи вдвое больше, чем у 133-МГц PCI-X. Тем не менее при использовании расширенного варианта параллельной шины PCI-X возникают серьезные проблемы с проектированием. Разъемы для нее громоздкие и дорогие, а строгие требования к проектированию значительно повышают стоимость системных плат по мере роста частот. Кроме того, на высоких частотах допускается подключение к шине PCI-X 2.0 только одного устройства ввода-вывода в конфигурации "точка-точка".

Узкие места серверных систем

На рис. 3 показаны внутренние системные межсоединения в типичной двухпроцессорной серверной системе. В этой архитектуре расширение полосы пропускания обеспечивается с помощью фирменного интерфейса между микросхемами северного моста и моста PCI-X. Несколько шин PCI-X подключаются к высокоскоростным слотам расширения, 10-Гбит Ethernet и дискам SAS/SATA. Но эта архитектура имеет несколько недостатков. Специальные кристаллы мостов PCI-X соединяют несколько параллельных шин PCI-X со специальным последовательным межсоединением НМС. Такой подход связан с высокими затратами, неэффективен и приводит к задержке передачи между устройствами ввода-вывода и северным мостом. Например, этот подход предусматривает соединение последовательной фабрики 10 Гбит/с с 64-разрядной параллельной шиной, которая, в свою очередь, подключается через фирменный кристалл моста PCI-X к последовательному межсоединению в северном мосте.

Рис. 3. Современная двухпроцессорная архитектура процессора.

Кроме того, технология внешнего ввода-вывода в серверах нового поколения требует намного более широкой полосы пропускания, чем способна обеспечить 133-МГц шина PCI-X. Эти технологии включают такие фабрики, как 10-Гбит Ethernet, Fibre Channel 10 Гбит/с и 4x Infiniband, а также будущие высокоскоростные интерфейсы жестких дисков - SATA и SAS 3 Гбит/с. В случае фабрики 10 Гбит/с каждый порт с пропускной способностью 10 Гбит/с может передавать данные в обоих направлениях с пиковой скоростью 2 Гбайт/с, а 133-МГц шина PCI-X обеспечивает максимальную скорость 1 Гбайт/с в одном направлении в один момент времени. Это означает, что 133-МГц шина PCI-X способна обработать пиковую пропускную способность таких фабрик не более чем на 50%.

Хотя PCI-X 2.0 с частотой 266 МГц удвоит ширину пиковой полосы пропускания PCI-X - до 2 Гбайт/с, ее все же будет недостаточно для суммарных 4 Гбайт/с, которые нужны двухпортовому контроллеру фабрики 10 Гбит/с. Ясно, что клиентским системам и серверам требуется замена параллельной шины PCI и ее вариантов.

PCI Express

PCI Express предоставляет масштабируемую высокоскоростную последовательную шину ввода-вывода. Многоуровневая архитектура PCI Express поддерживает существующие приложения PCI и драйверы за счет обратной совместимости с существующей моделью PCI. В частности, архитектура PCI Express определяет высокопроизводительную масштабируемую последовательную шину "точка-точка". Канал PCI Express состоит из двух однонаправленных каналов, каждый из которых реализован как пара передачи и пара приема для одновременной передачи в обоих направлениях. Каждая пара состоит из двух низковольтных пар дифференциальных сигналов. Таймер синхронизации встроен в каждую пару и использует схему кодировки для синхронизации 8b/10b, позволяя достичь высокой скорости передачи данных. На рис. 4 представлены каналы PCI в сравнении с PCI Express.


Рис. 4. PCI в сравнении с PCI Express.

Многоуровневая архитектура PCI Express

Уровень Конфигурация/ОС определяет стандартный механизм (в соответствии со спецификацией PCI Plug-and-Play) инициализации устройств, их нумерацию и конфигурирование. Этот уровень общается с уровнем ПО, инициирующего передачу данных между периферийными устройствами или получение данных от подключенной периферии. Интерфейс PCI Express разрабатывался как совместимый с существующими ОС, но для поддержки мощных функций технологии потребуются ОС будущего времени.

Уровень Программное обеспечение генерирует запросы чтения и записи к периферийным устройствам. PCI Express обеспечивает инициализацию и совместимость с ПО PCI. Как и в PCI, модель инициализации PCI Express позволяет ОС обнаруживать новые аппаратные устройства и распределять ресурсы системы. PCI Express сохраняет пространство конфигурирования PCI и программирование устройств ввода-вывода, и все ОС будут загружаться, не требуя модификации, в системах с использованием PCI Express. Сохраняется и модель выполнения ПО PCI, что позволяет запускать существующее ПО без всякой модификации.

Уровень Транзакций читает и записывает запросы от уровня ПО к канальному уровню с помощью протокола на основе пакетов и обеспечивает соответствие ответных пакетов запросам ПО. Этот уровень поддерживает 32-разрядную и расширенную 64-разрядную адресацию памяти, адресное пространство PCI памяти, ввода-вывода и конфигурации, а также новое пространство сообщений для таких сообщений, как прерывания и сбросы.

Канальный уровень добавляет последовательность пакетов и обнаружение ошибок на основе циклических кодов избыточности (CRC) к пакетам данных, создавая надежный механизм передачи данных между системным НМС и контроллером ввода-вывода.

Физический уровень базируется на двойных однонаправленных каналах PCI Express. Это обеспечивает гибкость и позволяет использовать разные технологии и частоты. Благодаря такому подходу первоначальную кремниевую технологию можно будет со временем заменить инновациями, которые сохранят обратную совместимость. Например, для повышения скорости передачи данных можно использовать оптоволоконную технологию.

Механический уровень определяет форм-факторы периферийных устройств.

Уровни архитектуры PCI Express

Ширину пропускания канала PCI Express можно масштабировать за счет добавления сигнальных пар для формирования нескольких линий между двумя устройствами. Спецификация поддерживает ширину линии x1, x4, x8 и x16 и соответственно расщепляет байты данных по линиям. После того, как два агента на обоих концах канала PCI Express договорятся о ширине линии и частоте передачи, байты данных передаются расщепленными по линиям с кодировкой.

Базовый канал x1 имеет пиковую "сырую" полосу пропускания на уровне 2,5 Гбит/с. Поскольку шина работает в двух направлениях (данные могут одновременно передаваться в обоих направлениях), эффективная "сырая" скорость передачи равна 5 Гбит/с. В табл. 2 приведены скорости передачи данных с кодированием и без кодирования при реализации линий x1, x4, x8 и x16, которые определены в первой версии PCI Express.

Таблица 2. Полоса пропускания PCI Express

В будущих реализациях PCI Express частота передачи данных по каналу еще больше увеличится. Например, после появления второго поколения PCI Express частота передачи вырастет не менее чем вдвое. Благодаря архитектуре "точка-точка" вся полоса пропускания каждой шины PCI Express выделяется устройству на конце канала. Несколько устройств PCI могут работать одновременно, не мешая друг другу.

PCI Express, в отличие от PCI, имеет минимальные сигналы боковой полосы, а временные метки и информация об адресе встроены в данные. Именно поэтому данная технология обеспечивает высокую полосу пропускания на один контакт разъема ввода-вывода по сравнению с PCI (рис. 5). В результате соединители становятся более эффективными, компактными и дешевыми.

Технология PCI Express надежно обеспечивает более высокие скорости передачи данных за счет низковольтных дифференциальных сигналов. При таком подходе сигнал идет от источника к получателю по двум линиям: по одной посылается "позитивный" образ, по другой - "негативный", или "перевернутый" образ сигнала. Из-за строгих правил маршрутизации шум, влияющий на одну линию, влияет и на другую. Приемник получает оба сигнала, инвертирует негативную версию обратно в позитивную и суммирует два собранных сигнала, в результате шумы эффективно удаляются.

В первоначальной спецификации PCI Express определены графические платы мощностью до 75 Вт. Сейчас разрабатывается новая спецификация графики PCI Express для карт мощностью до 150 Вт. Эти характеристики соответствуют требованиям графических адаптеров, для которых сейчас предел мощности составляет 41 Вт для массовых карт AGP и 110 Вт для карт AGP Pro 110.

Полоса пропускания PCI Express

Полоса пропускания PCI Express обычно обозначается как "кодированная" полоса пропускания. PCI Express использует кодировку 8b/10b, которая транслирует 8-разрядные данные в 10-битную последовательность передаваемых символов. Этот подход улучшает физический сигнал, что облегчает синхронизацию битов, упрощает проектирование приемников и передатчиков, совершенствует обнаружение ошибок и позволяет отличить управляющие символы от символов данных.

Ширина "кодированной" полосы пропускания базовой линии x1 PCI Express равна 5 Гбит/с. Однако более точную цифру дает полоса пропускания "без кодировки", ширина которой составляет 80% "кодированной", т. е. 4 Гбит/с. В табл. 2 приведена полоса пропускания PCI Express с кодировкой и без нее.

Расширенные функции PCI Express

В PCI Express предусмотрены расширенные функции, которые будут постепенно реализовываться по мере их поддержки ОС и устройствами, а также по мере их использования приложениями. В список этих функций входят:

  • расширенное управление энергопотреблением;
  • поддержка трафика данных в реальном времени;
  • горячая замена;
  • целостность данных и обработка ошибок.

Расширенное управление энергопотреблением

Управление в PCI Express позволяет уменьшить энергопотребление, если шина не активна (т. е. данные не пересылаются между компонентами и периферийными устройствами). Интерфейс PCI Express должен быть активным все время, чтобы передатчик и получатель работали синхронно. Для этого, если нет данных для передачи, непрерывно посылаются пустые символы, получатель декодирует их и отбрасывает. Этот процесс потребляет дополнительную энергию, что, в частности, уменьшает время работы от батарей ноутбуков и карманных компьютеров.

Для решения этой проблемы спецификация PCI Express определяет два состояния канала с низким энергопотреблением и протокол Active-State Power Management (ASPM). Когда канал PCI Express не используется, он может перейти в одно из двух состояний с низким энергопотреблением. Эти состояния экономят энергию, но требуют времени на восстановление для ресинхронизации передатчика и получателя, когда нужно передать данные. Чем дольше время восстановления (или запаздывания), тем ниже энергопотребление.

Поддержка трафика реального времени

PCI Express, в отличие от PCI, поддерживает изохронную (или зависимую от времени) передачу данных и разные уровни QoS. Эти функции реализованы с помощью "виртуальных каналов", которые гарантируют, что конкретные пакеты данных прибудут по своему конечному адресу в определенный момент времени. PCI Express поддерживает несколько изохронных виртуальных каналов (каждый с независимым сеансом связи) на одну линию. Все эти каналы могут иметь разную доступность. Данное законченное решение предназначено для приложений, требующих доставки данных в реальном времени (такова, например, работа с аудио и видео в реальном времени).

Горячая замена

Системы на базе PCI не имеют встроенной поддержки горячей замены плат ввода-вывода. Уже после выпуска стандарта PCI как дополнение к нему была разработана функция горячей замены серверных карт и PC Card с ограниченными возможностями. Эти решения рассчитаны на растущие требования серверов и портативных компьютеров. Во-первых, часто трудно или невозможно запланировать отключение сервера для замены или установки периферийных карт. Возможность горячей замены устройств ввода-вывода сводит к минимуму простои. Во-вторых, пользователям ноутбуков нужно заменять в горячем режиме карты, обеспечивающие такие функции ввода-вывода, как мобильный диск и работа в сети.

В PCI Express реализована оригинальная поддержка для горячей замены периферии ввода-вывода. Единая программная модель может использоваться для всех форм-факторов PCI Express.

Целостность данных и обработка ошибок

Интерфейс PCI Express поддерживает целостность данных на уровне каналов для всех типов пакетов транзакций и каналов данных. Благодаря этому обеспечивается целостность данных при их передаче для приложений высокой доступности, особенно для выполняющихся на серверных системах. PCI Express также поддерживает обработку ошибок PCI и использует усовершенствованный механизм оповещения об ошибках и их обработки, что расширяет возможности решений для изоляции сбоев и восстановления работоспособности.

Форм-факторы PCI Express

Разработаны различные форм-факторы PCI Express, предназначенные для клиентских систем, серверов и портативных компьютеров. В их числе стандартные и низкопрофильные карты - для настольных ПК, рабочих станций и серверов, Mini Card - для портативных компьютеров, ExpressCard - для портативных и настольных ПК, а также модули Server I/O Module (SIOM).

Стандартные и низкопрофильные карты

Выпускаемые сейчас стандартные и низкопрофильные карты PCI используются на различных платформах, включая серверы, рабочие станции и настольные ПК. PCI Express также определяет стандартные и низкопрофильные карты, которые могут заменить устаревшие карты PCI и сосуществовать с ними. Эти карты имеют те же размеры, что и карты PCI, и оборудованы задними скобами для внешних кабельных соединений.

Карты PCI и PCI Express отличаются соединителями ввода-вывода - разъем x1 PCI Express имеет 36 контактов, а у стандартного соединителя PCI их 120.

Коннектор x1 PCI Express намного меньше, чем у карты PCI Card. Рядом с разъемом PCI Express расположена маленькая заглушка, которая не позволяет вставить его в слот PCI. Стандартные и низкопрофильные форм-факторы также поддерживают реализации x4, x8 и x16. На рис. 6 показаны размеры соединителей PCI в сравнении с разъемами PCI, AGP 8X и PCI-X, которые они заменят на системной плате.

В табл. 3 приведены требования к совместимости для стандартных и низкопрофильных карт PCI Express. Карта x1 может использоваться во всех четырех слотах системной платы: x1, x4, x8 и x16. Когда карта x1 вставляется в слот с более высокой скоростью, канальный уровень снижает скорость канала до x1.

Таблица 3. Совместимость карт PCI Express Card

Реализация PCI Express Слот x1 Слот x4 Слот x8 Слот x16
Карта x1 Нужна Нужна Нужна Нужна
Карта x4 Нет Нужна Допускается Допускается
Карта x8 Нет Допускается* Нужна Допускается
Карта x16 Нет Нет Нет Нужна
*Эта реализация будет иметь коннектор x8 на слоте x4, т. е. в такой слот можно вставлять карты x8,
которые, однако, будут работать на скорости x4.

Переход на карты PCI Express

Платы клиентских систем будут постепенно переходить от соединителей PCI к соединителям x1 PCI Express. Рабочие станции соответственно будут переходить от PCI на разъемы x1 PCI Express и от PCI-X - к x4 PCI Express. Соединитель AGP 8X будет заменяться разъемом x16 PCI Express. В отличие от AGP, он может использоваться для других карт PCI Express, если не требуется графическая карта PCI Express.

Серверы будут постепенно переходить от соединителей PCI-X в основном на x4 и x8. Использование в серверных системах комбинации слотов PCI Express и PCI/PCI-X позволит покупателям адаптироваться к новой технологии при сохранении поддержки унаследованных систем.

Рассмотрим пример типичной современной клиентской системы и переходной системной платы PCI Express. Системная плата PCI содержит пять стандартных слотов PCI и один слот AGP. Системная плата PCI Express также имеет шесть слотов ввода-вывода, но только три из них - слоты PCI, а еще два - это соединители x1 PCI Express и один - разъем x16 PCI Express, заменяющий слот AGP 8X. Соединители PCI Express на системной плате иногда делают черными, чтобы отличить их от белых слотов PCI и коричневых AGP.

Конечно, первыми устройствами, которые перейдут на карты PCI Express, станут платы с повышенными требованиями к полосе пропускания. В клиентских системах это графические адаптеры, адаптеры стандарта IEEE 1394, Gigabit Ethernet и ТВ-тюнеры, а в серверных системах - карты Ultra320 SCSI RAID, HBA-адаптеры Fibre Channel и карты Gigabit Ethernet и 10 Gigabit Ethernet. Ожидается, что стоимость этих плат будет сравнима с ценой аналогичных PCI-X, а в некоторых случаях даже меньше. Другие карты также постепенно перейдут на PCI Express, но может потребоваться несколько лет, прежде чем недорогие карты, работающие с низкой пропускной способностью (например, модемы), начнут использовать эту технологию. Таким образом, как это было и с переходом от ISA к шине PCI, еще долгие годы PCI и PCI Express будут сосуществовать.

PCI Express Mini Card

PCI Express Mini Card заменят Mini PCI, представляющие собой маленькую внутреннюю плату, по своей функциональности аналогичную картам PCI для настольных ПК. Карты Mini PCI используются в основном для реализации сетевых функций в портативных компьютерах, выпускаемых серийно или на заказ. По размерам PCI Express Mini Card вдвое меньше Mini PCI, что позволяет проектировщикам ноутбуков предусмотреть место для одной или двух карт в зависимости от размера компьютера.

PCI Express Mini Card может использовать PCI Express и/или USB 2.0. Разъем PCI Express Mini Card на системной плате должен поддерживать как канал x1 PCI Express, так и USB 2.0. Поддержка USB 2.0 облегчит переход на PCI Express, потому что производителям периферии нужно определенное время для реализации поддержки PCI Express в своих наборах микросхем. В переходный период PCI Express Mini Card можно будет легко подключать с помощью USB 2.0.

ExpressCard

ExpressCard - это маленькая модульная дополнительная карта, которая в течение следующих лет должна заменить PC Card. Спецификация ExpressCard была разработана ассоциацией Personal Computer Memory Card International Association (PCMCIA, http://www.pcmcia.org). Форм-фактор ExpressCard обеспечивает замену PC Card с меньшими размерами и стоимостью и более высокой производительностью. Как и PCI Express Mini Card, модуль ExpressCard поддерживает каналы x1 PCI Express и USB 2.0. Низкая цена делает его оптимальным для настольных систем с уменьшенным форм-фактором. Модуль ExpressCard также имеет пониженное энергопотребление, и его можно вставлять в горячем режиме. Скорее всего, ExpressCard будут использоваться в сетевых платах, жестких дисках и будущих технологиях ввода-вывода.

PCI Express Server I/O Module

Массовое появление модулей SIOM ожидается после выхода второго поколения PCI Express. PCI Express SIOM обеспечивает форм-фактор, который легко установить и заменить. Он будет модульным, что позволит устанавливать и обслуживать карты ввода-вывода без прерывания работы системы и не открывая корпус компьютера.

SIOM предусматривает более радикальное изменение форм-фактора, чем другие варианты PCI Express. Он решит многие проблемы с серверными картами PCI и PCI-X. Конструкция SIOM делает карты более надежными, что особенно важно в центрах обработки данных. Модуль также разрабатывался с расчетом на принудительную вентиляцию, поскольку мощным серверам свойственно высокое тепловыделение. Потоки охлаждающего воздуха могут идти сзади, сверху или снизу модуля. Такая гибкость дает проектировщикам систем больше свободы при оценке вариантов охлаждения стоечных систем, оборудованных SIOM.

Модули SIOM с самым большим форм-фактором способны выполнять сравнительно сложные функции и использовать весь диапазон каналов PCI Express.

Примеры систем с PCI Express

Рассмотрим, как технология PCI Express может быть реализована в клиентской и серверной системах. Первоначально канал x16 PCI Express заменит шину AGP между графической подсистемой и северным мостом. Вариант PCI Express может заменить и канал между обоими мостами НМС. Предусмотрено также несколько каналов PCI Express от южного моста к контроллеру сетевого интерфейса (NIC), устройствам IEEE 1394 и другой периферии. Южный мост будет по-прежнему поддерживать устаревшие слоты PCI.

Такая архитектура дает покупателям несколько важных преимуществ. Настольные системы еще долго будут оснащаться шинами как PCI, так и PCI Express. Первые поколения серверов PCI Express также будут иметь слоты PCI-X для устаревших карт PCI-X. Чтобы упростить переход, предусмотрена защита от ошибочной установки PCI в слоты PCI Express и карт PCI Express - в слоты PCI. Кроме того, PCI Express обеспечивает широкое применение карт Gigabit Ethernet, 10 Gigabit Ethernet, 1394b и других высокоскоростных устройств в клиентских системах. Он также поддерживает растущие требования к полосе пропускания графических подсистем.

PCI Express может применяться в двухпроцессорной серверной архитектуре, значительно упрощая систему. Каналы PCI Express для устройств ввода-вывода и слотов подключаются непосредственно к северному мосту. Такой подход дает ряд преимуществ. Во-первых, это высокая полоса пропускания для ввода-вывода следующего поколения, например, 10 Gigabit Ethernet и фабрики x4 Infiniband. Например, канал x8 PCI Express способен обеспечить пиковую полосу пропускания, которая требуется двухпортовому контроллеру 10 Гбит/с.

Во-вторых, меньше становятся расходы на внедрение. Удается подключить к системному набору микросхем больше слотов и встроенных устройств ввода-вывода, что уменьшает число микросхем моста и снижает требования к маршрутизации сигналов на системной плате. И наконец, за счет отказа от использования микросхемы моста PCI-X уменьшается запаздывание передачи между устройствами ввода-вывода и центральным процессором и памятью.

Таким образом, технология PCI Express обеспечивает надежное и масштабируемое последовательное соединение, обратно совместимое с PCI. Как и PCI, она будет использоваться в широком спектре существующих платформ, включая серверы, портативные компьютеры, настольные системы и рабочие станции. Она также позволит реализовать новаторскую конструкцию модульных компьютерных систем.

PCI Express «родилась» 22 июля 2002 года. Ее создателем стала корпорация Intel, именно в этот день стала доступна её техническая документация. До этого момента, на этапе разработки «шина» имела обозначение 3GIO (third generation input-output). Два этих названия были брендированы PCI SIG (организацией, которая теперь продвигает этот стандарт).

PCIe — высокопроизводительное соединение «точка – точка», пришедшее на смену шине PCI (читается, как ПиСиАй). Физически отличается тем, что не использует общие выделенные линии для связи с процессором, а имеет свои собственные, для каждого подключенного устройства. Напряжение передачи сигнала составляет 0,8 вольт. Каждый канал – представляет собой два физических проводника (четыре контакта). При транслировании информации восемь бит кодируется десятью, что дает неплохую защиту от помех.

Роднит с предшественником ее общая программная модель. Для передачи данных, которая в данном случае осуществляется последовательно, применяется физический протокол с большой пропускной способностью. Используется для подключения высокопроизводительных периферийных устройств. За псевдошиной закрепилась роль локального канала обмена данными.

Отличия PCI Express от PCI

PCI – прежде всего шина, то есть общий канал, который делят все подключенные к нему устройства. А PCI Express – для каждого устройства имеет свои пути, которые оформлены физически. Преемственность цифровой структуры трансфера информации упрощает адаптацию существующих изделий, ранее выпускавшихся для работы со старой шиной. На производстве оказывается достаточным внести незначительные поправки в конструкцию и можно выпускать ту же разновидность, но с новым интерфейсом.

Принцип работы, совместимость

Являясь двусторонним, соединение передает данные последовательно в пакетном режиме. Пропускная способность зависит от исполнения в каждом конкретном случае. PCI Express бывают одна (1х), две и более линий транспорта (2Х, 4Х, 6х, 8х, 12х, 16х, 32х), что определяет длину слота на системной плате. Характерно, что аппаратура способна работать c любым из них, но приспособленные для серьезных скоростей карты расширения не могут физически поместиться в менее производительные разъемы, просто не совпадая в размере. Хотя наоборот, менее продуктивные платы расширения, имеющие короткие контактные группы — легко помещаются в большие и корректно работают.

В таблице мы привели сводную таблицу соотношения количества линий и пропускной способности :

Сейчас доступно несколько спецификаций шины:

  • PCI Express 1.0 и 1.1. Первые и наименее производительные решения, которые сейчас практически не используются. Сохраняются на старых платах, еще встречающихся в эксплуатации.
  • 2.0. Переработке и усовершенствованию подверглись все сколько-нибудь определяющие производительность качества, усовершенствованы логические протоколы, всесторонне оптимизировано управление связью, улучшено автоопределение подключаемых модулей.
  • Внешняя кабельная спецификация PCIe . Позволяет соединять оборудование кабелем длинной до 10 м.
  • 2.1. Промежуточный аналог 2.0 с некоторыми расширенными возможностями, предшествующими появлению 3.0.
  • 3.0. Скорость в 8 гигатранзакций в секунду (ГТ/с) стала доступной благодаря новой системе шифрования 128b/130b. Таким образом разница между pci 2.0 и 3.0 в шифровании и скорости передачи данных.
  • 4.0. Утвержден стандарт недавно — 5.10.2017. По сравнению с предыдущим — скорость удвоена. Возросли отдельные показатели, связанные с виртуализацией, оптимизирована передача пакетов данных.
  • 5.0. Ориентировочно, релиз запланирован зимой-весной 2019. Заявлена расширенная поддержка приложений, визуализирующих виртуальную реальность.

Существующие разъемы и виды портов

Портов подключения для интерфейса существуют множество. Рассмотрим некоторые, самые распространённые из них:

  • MiniPCI-E (M.2). Общая шина для некоторых наиболее распространённых компьютерных протоколов и устройств с интерфейсом x1 и х4 PCIe.
  • ExpressCard. Аналогичный разъем, но с выводом шины только для x1 PCIe.
  • AdvancedTCA, MicroTCA – порты для аппаратуры связи.
  • MobilePCIExpressModule (MXM) – разработка NVIDIA для соединения видеокарт.
  • StackPC – для создания суперкомпьютеров, позволяет масштабировать вычислительные устройства.

Как узнать версию PCI Express на материнской плате

Обычно пишется возле самого слота на материнской плате, но может быть нанесено в другом месте. Еще часто пишут на упаковке материнской платы и указывают в руководстве. Можно зайти на официальный сайт и вбить в поиск серийник системной платы, или попробовать поискать спецификацию по названию и ревизии (разновидность).

Самая часто встречающаяся периферия для наиболее производительных слотов х16 – это видеокарты и ssd-диски. Не редки и контролеры типа дополнительных USB, SATA и подобных им скоростных портов или разнообразные адаптеры, такие как звуковые, музыкальные карты, Wi-Fi модули.

Видеокарта

Жесткий диск

Беспроводной адаптер

Распиновка PCI Express

Исчерпывающе показать расположение выходов линий связи проще на примере линий самого крупного и скоростного порта.

Устройство контактной группы слота PCI-Express 16x:

Соединение PCIe доказало свою эффективность. Оно отвечает всем современным требованиям по скорости передачи информации и стабильности работы. Обладая огромным потенциалом модернизации позволяет сохранять совместимость многочисленных устройств разного поколения: контролеров, адаптеров. Кроме того, служит широким каналом, позволяющим наращивать вычислительные мощности. Особенным и неожиданным местом применения этой технологии стала телекоммуникационная сфера.

Появившись в 2002 году, эта разновидность транспорта данных до сих пор остается самой актуальной, распространенной, непрерывно развивающейся и по-прежнему перспективной.

ВведениеРаньше массового покупателя интересовало главным образом лишь два типа твердотельных накопителей: либо высокоскоростные модели премиального уровня вроде Samsung 850 PRO, либо выгодные по соотношению цены и производительности предложения, такие как Crucial BX100 или SanDisk Ultra II. То есть, сегментация рынка SSD была крайне слабой, а конкуренция между производителями хоть и разворачивалась по направлениям производительности и цены, разрыв между решениями верхнего и нижнего уровня оставался достаточно небольшим. Такое положение дел было отчасти обусловлено тем, что технология SSD сама по себе существенно улучшает ощущения пользователя от работы с компьютером, и поэтому вопросы конкретной реализации для многих отходят на второй план. По этой же причине потребительские твердотельные накопители были вписаны в старую инфраструктуру, которая изначально ориентировалась на механические жёсткие диски. Это существенно облегчило их внедрение, однако заключило SSD в достаточно узкие рамки, которые во многом сдерживают как рост пропускной способности, так и снижение латентности дисковой подсистемы.

Но до определённых пор такое положение дел всех устраивало. Технология SSD была в новинку, и пользователи, переходящие на твердотельные накопители, оставались довольны своим приобретением даже несмотря на то, что по сути они получали продукты, которые на самом деле работают далеко не на пределе своих возможностей, а их производительность сдерживается искусственными барьерами. Однако к сегодняшнему дню SSD, пожалуй, можно считать уже самым настоящим мэйнстримом. Любой уважающий себя владелец персонального компьютера если и не имеет хотя бы один SSD в своей системе, то очень серьёзно настроен на его приобретение в самое ближайшее время. И в этих условиях производители просто вынуждены задумываться о том, чтобы развернуть, наконец, полноценную конкуренцию: разрушить все барьеры и перейти к выпуску более широких линеек продукции, принципиально различающихся по предлагаемым характеристикам. Благо для этого подготовлена вся необходимая почва, и, в первую очередь, большинство разработчиков SSD имеют желание и возможности для того, чтобы заняться выпуском продуктов, работающих не через наследственный SATA-интерфейс, а через куда более производительную шину PCI Express.

Поскольку пропускная способность SATA ограничена величиной 6 Гбит/с, максимальная скорость флагманских SATA SSD не выходит за величину порядка 500 Мбайт/с. Тем не менее, современные накопители, основанные на флеш-памяти, способны на гораздо большее: ведь если задуматься, то они имеют больше общего с системной памятью, нежели с механическими жёсткими дисками. Что же касается шины PCI Express, то сейчас она активно применяется в качестве транспортного уровня при подключении графических карт и прочих дополнительных контроллеров, нуждающихся в обмене данными с высокой скоростью, например, Thunderbolt. Одна линия PCI Express второго поколения обеспечивает пропускную способность на уровне 500 Мбайт/с, а линия PCI Express 3.0 может развивать скорость до 985 Мбайт/с. Таким образом, интерфейсная карта, устанавливаемая в слот PCIe x4 (с четырьмя линиями), может обмениваться данными на скорости до 2 Гбайт/с в случае PCI Express 2.0 и до почти 4 Гбайт/с – при использовании PCI Express третьего поколения. Это отличные показатели, которые вполне подходят и для современных твердотельных накопителей.

Из сказанного закономерно следует, что на рынке помимо SATA SSD должны постепенно находить распространение высокоскоростные накопители, использующие шину PCI Express. И это действительно происходит. В магазинах можно найти несколько моделей потребительских твердотельных накопителей от ведущих производителей, выполненных в виде карт расширения или M.2-плат, которые используют разные варианты шины PCI Express. Мы решили собрать их вместе и сравнить между собой по производительности и другим параметрам.

Участники тестирования

Intel SSD 750 400 Гбайт

На рынке твердотельных накопителей компания Intel придерживается довольно-таки нестандартной стратегии и разработке SSD для потребительского сегмента уделяет не слишком серьёзное внимание, концентрируясь на продуктах для серверов. Однако её предложения от этого не становятся неинтересными, особенно если речь идёт о твердотельном накопителе для шины PCI Express. В данном случае Intel решила адаптировать для использования в высокопроизводительном клиентском SSD свою самую прогрессивную серверную платформу. Именно таким образом и родился Intel SSD 750 400 Гбайт, который получил не только впечатляющие характеристики быстродействия и ряд технологий серверного уровня, отвечающих за надёжность, но и поддержку новомодного интерфейса NVMe, о котором несколько слов стоит сказать отдельно.




Если говорить о конкретных улучшениях NVMe, то в первую очередь упоминания заслуживает снижение накладных расходов. Например, пересылка наиболее типичных 4-килобайтных блоков в новом протоколе требует подачи лишь одной команды вместо двух. А весь набор управляющих инструкций упрощён настолько, что их обработка на уровне драйвера снижает загрузку процессора и возникающие при этом задержки как минимум вдвое. Второе важное нововведение – поддержка глубокой конвейеризации и многозадачности, заключающаяся в возможности параллельно создавать множественные очереди запросов вместо имевшейся ранее единой очереди на 32 команды. Интерфейсный протокол NVMe способен обслуживать до 65536 очередей, причём каждая из них может содержать до 65536 команд. Фактически какие-либо ограничения ликвидируются вообще, и это очень важно для серверных сред, где на дисковую подсистему может возлагаться огромное количество одновременных операций ввода-вывода.



Но несмотря на работу через интерфейс NVMe, Intel SSD 750 – это всё же не серверный, а потребительский накопитель. Да, почти такая же аппаратная платформа, как в этом накопителе, используется в SSD серверного класса Intel DC P3500, P3600 и P3700, но в Intel SSD 750 применена более дешёвая ординарная MLC NAND, а кроме того модифицирована прошивка. Производитель считает, что благодаря таким изменениям получившийся продукт понравится энтузиастам, поскольку он сочетает высокую мощность, принципиально новый интерфейс NVMe и не слишком пугающую стоимость.

Intel SSD 750 представляет собой PCIe x4 карту половинной высоты, которая может задействовать четыре линии стандарта 3.0 и развивать последовательные скорости передачи данных до 2,4 Гбайт/с, а скорость случайных операций – до 440 тысяч IOPS. Правда, наибольшей производительностью отличается наиболее ёмкая модификация на 1,2 Тбайт, полученная же нами на тесты версия объёмом 400 Гбайт немного помедленнее.



Плата накопителя полностью закрыта бронёй. С лицевой стороны это алюминиевый радиатор, а с оборотной – декоративная металлическая пластина, которая на самом деле с микросхемами не соприкасается. Следует отметить, что применение здесь радиатора – необходимость. Основной контроллер интеловского SSD выделяет немало тепла, и при высокой нагрузке даже оснащённый таким охлаждением накопитель может разогреваться до температур порядка 50-55 градусов. Но благодаря предустановленному охлаждению никаких намёков на троттлинг не наблюдается – производительность остаётся постоянной даже в процессе непрерывного и интенсивного использования.



В основе Intel SSD 750 лежит контроллер серверного уровня Intel CH29AE41AB0, который работает на частоте 400 МГц и обладает восемнадцатью (!) каналами для подключения флеш-памяти. Если учесть, что большинство контроллеров для потребительских SSD располагают либо восемью, либо четырьмя каналами, становится понятно, что Intel SSD 750 действительно может прокачивать по шине значительно больше данных, чем привычные модели SSD.



Что касается используемой флеш-памяти, то в этой части Intel SSD 750 не проводит никаких инноваций. Он основывается на обычной MLC NAND интеловского же производства, выпущенной по 20-нм техпроцессу и имеющей ядра объёмом и 64, и 128 Гбит вперемежку. Следует заметить, что большинство прочих производителей SSD достаточно давно отказались от подобной памяти, перейдя на чипы, сделанные по более тонким нормам. Да и сама Intel начала перевод на 16-нм память не только своих потребительских, но и серверных накопителей. Однако несмотря на всё это, в Intel SSD 750 устанавливается более старая память, которая предположительно имеет более высокий ресурс.

Серверное происхождение Intel SSD 750 прослеживается ещё и в том, что общий объём флеш-памяти у этого SSD составляет 480 ГиБ, от которых пользователю доступно лишь около 78 процентов. Остальное отводится на подменный фонд, сборку мусора и технологии защиты данных. В Intel SSD 750 реализована традиционная для флагманских накопителей RAID 5-подобная схема на уровне кристаллов MLC NAND, что позволяет успешно восстанавливать данные даже в том случае, когда один из чипов полностью выходит из строя. Кроме того, интеловский SSD обеспечивает полную защиту данных от перебоев питания. На Intel SSD 750 имеется два электролитических конденсатора, и их ёмкости хватает для штатного завершения работы накопителя в автономном режиме.

Kingston HyperX Predator 480 Гбайт

Kingston HyperX Predator – это куда более традиционное по сравнению с Intel SSD 750 решение. Во-первых, работает оно через протокол AHCI, а не NVMe, а во-вторых, для подключения к системе этому SSD требуется более распространённая шина PCI Express 2.0. Всё это делает вариант Kingston несколько медленнее – пиковые скорости при последовательных операциях не превышают 1400 Мбайт/с, а случайные – 160 тысяч IOPS. Но зато HyperX Predator не накладывает никаких специальных требований на систему – он совместим с любыми, в том числе и старыми платформами.

Вместе с этим, накопитель имеет не совсем простую двухкомпонентную конструкцию. Сам SSD представляет собой плату в форм-факторе M.2, которая дополнена PCI Express переходником, позволяющим подключать M.2-накопители через обычные полноразмерные PCIe слоты. Переходник выполнен в виде PCIe x4 карты половинной высоты, задействующей все четыре линии PCI Express. Благодаря такой конструкции Kingston продаёт свой HyperX Predator в двух вариантах: как PCIe SSD для десктопов и как M.2-накопитель для мобильных систем (в этом случае переходник в поставку не включается).



Kingston HyperX Predator базируется на контроллере Marvell Altaplus (88SS9293), который с одной стороны поддерживает четыре линии PCI Express 2.0, а с другой – имеет восемь каналов для подключения флеш-памяти. На данный момент это – самый быстрый серийно выпускаемый SSD-контроллер фирмы Marvell с поддержкой PCI Express. Однако вскоре у Marvell появятся и более быстрые последователи с поддержкой NVMe и PCI Express 3.0, которой у чипа Altaplus нет.



Поскольку сама компания Kingston не производит ни контроллеров, ни памяти, собирая свои SSD из элементной базы, закупаемой у других производителей, нет ничего странного в том, что в основе HyperX Predator PCIe SSD лежит не только сторонний контроллер, но и 128-гигабитные 19-нм чипы MLC NAND компании Toshiba. Такая память имеет невысокую закупочную цену и ставится сейчас во многие продукты Kingston (и других фирм), и в первую очередь в ширпотребные модели.



Однако использование подобной памяти породило парадокс: несмотря на то, что по своему формальному позиционированию Kingston HyperX Predator PCIe SSD – это продукт премиального класса, на него даётся всего лишь трёхлетняя гарантия, а заявленное среднее время наработки на отказ значительно меньше, чем у флагманских SATA SSD других производителей.

Никаких особенных технологий защиты данных в Kingston HyperX Predator также не предусматривается. Но накопитель имеет сравнительно большую скрытую от глаз пользователя область, размер которой составляет 13 процентов от полной ёмкости накопителя. Входящая в неё резервная флеш-память используется для сборки мусора и выравнивания износа, но в первую очередь расходуется на подмену вышедших из строя ячеек памяти.

Остаётся лишь добавить, что в конструкции HyperX Predator не предусмотрено никаких специальных средств для отвода тепла от контроллера. В отличие от большинства прочих высокопроизводительных решений, радиатора у этого накопителя нет. Тем не менее, к перегреву этот SSD совершенно не склонен – его максимальное тепловыделение лишь немного превышает 8 Вт.

OCZ Revodrive 350 480 Гбайт

OCZ Revodrive 350 с полным правом можно назвать одним из самых старых потребительских твердотельных накопителей с интерфейсом PCI Express. Ещё в те времена, когда никто из прочих производителей о выпуске клиентских PCIe SSD даже не задумывался, в модельном ряду компании OCZ имелся RevoDrive 3 (X2) – прообраз современного Revodrive 350. Однако уходящие в прошлое корни PCIe-накопителя OCZ делают его несколько странным предложением на фоне актуальных конкурентов. В то время как большинство производителей высокопроизводительных накопителей для ПК пользуются современными контроллерами с врождённой поддержкой шины PCI Express, в Revodrive 350 реализована очень замысловатая и явно неоптимальная архитектура. Он базируется на двух или четырёх (в зависимости от объёма) контроллерах SandForce SF-2200, которые собраны в RAID-массив нулевого уровня.

Если говорить о принявшей участие в этом тестировании модели OCZ Revodrive 350 объёмом 480 Гбайт, то в её основе, фактически, лежат четыре SATA SSD ёмкостью по 120 Гбайт, каждый из которых базируется на собственном чипе SF-2282 (аналоге широко распространённого SF-2281). Затем эти элементы объединены в единый четырёхкомпонентный RAID 0-массив. Однако для этой цели используется не совсем привычный RAID-контроллер, а фирменный процессор виртуализации (VCA 2.0) OCZ ICT-0262. Впрочем, очень похоже на то, что под этим именем скрывается перелицованная микросхема Marvell 88SE9548, представляющая собой четырёхпортовый RAID-контроллер SAS/SATA 6 Гбит/с с интерфейсом PCI Express 2.0 x8. Но даже если и так, то инженеры OCZ написали для этого контроллера собственную прошивку и драйвер.



Уникальность программной составляющей RevoDrive 350 заключается в том, что в нём реализован не совсем классический RAID 0, а некое его подобие с интерактивной балансировкой нагрузки. Вместо разбиения потока данных на блоки фиксированного размера и последовательной их передачи на разные контроллеры SF-2282, технология VCA 2.0 предполагает анализ и гибкое перераспределение операций ввода-вывода в зависимости от текущей занятости контроллеров флеш-памяти. Поэтому RevoDrive 350 выглядит для пользователя как монолитный твердотельный накопитель. В его BIOS нельзя зайти, а обнаружить, что в недрах этого SSD скрывается RAID-массив, без подробного знакомства с аппаратной начинкой невозможно. Более того, в отличие от обычных RAID-массивов, в RevoDrive 350 поддерживаются все типичные функции SSD: SMART-мониторинг, TRIM и операция Secure Erase.

RevoDrive 350 выпускается в виде плат с интерфейсом PCI Express 2.0 x8. Несмотря на то, что все восемь линий интерфейса реально используются, заявленные показатели производительности заметно ниже их суммарной теоретической пропускной способности. Максимальная скорость последовательных операций ограничивается величиной 1800 Мбайт/с, а производительность произвольных операций не превышает 140 тысяч IOPS.

Стоит отметить, что выполнен OCZ RevoDrive 350 в виде PCI Express x8 платы полной высоты, то есть этот накопитель физически больше, чем все остальные участвующие в тестировании SSD, и поэтому он не может быть установлен в низкопрофильные системы. Лицевая поверхность платы RevoDrive 350 закрыта декоративным металлическим кожухом, по совместительству выступающим радиатором для базовой микросхемы RAID-контроллера. Контроллеры SF-2282 расположены на оборотной стороне платы и какого-либо охлаждения лишены.



Для формирования массива флеш-памяти OCZ воспользовалась микросхемами своей материнской компании – Toshiba. Используются чипы, производимые по 19-нм техпроцессу и имеющие ёмкость 64 Гбит. Общий объём флеш-памяти в RevoDrive 350 480 Гбайт составляет 512 Гбайт, но 13% зарезервировано под внутренние нужды – выравнивание износа и сборку мусора.



Стоит отметить, что архитектура RevoDrive 350 не уникальна. На рынке представлены ещё несколько моделей подобных SSD, работающих по принципу «RAID-массив из SATA SSD на базе контроллеров SandForce». Однако все такие решения, как и рассматриваемый PCIe-накопитель OCZ отличаются неприятным недостатком – их производительность на операциях записи деградирует со временем. Связано это с особенностями внутренних алгоритмов контроллеров SandForce, операция TRIM у которых не возвращает скорость записи до первоначального уровня.



Тот бесспорный факт, что RevoDrive 350 стоит на ступеньку ниже PCI Express накопителей нового поколения подчёркивается и тем, что на этот накопитель даётся всего трёхлетняя гарантия, а его гарантируемый ресурс записи составляет лишь 54 Тбайт – в разы меньше, чем у конкурентов. Более того, несмотря на то, что RevoDrive 350 основывается на том же дизайне, что и серверный Z-Drive 4500, никакой защиты от перепадов напряжения питания он не имеет. Однако всё это не мешает OCZ с присущей ей дерзостью позиционировать RevoDrive 350 в качестве премиального решения уровня Intel SSD 750.

Plextor M6e Black Edition 256 Гбайт

Сразу же необходимо отметить, что накопитель Plextor M6e Black Edition является прямым последователем хорошо известной модели M6e . Похожесть новинки на предшественницу прослеживается почти во всём, если говорить о технической, а не эстетической составляющей. Новый SSD точно так же имеет двухкомпонентную конструкцию, включая в себя собственно накопитель в формате M.2 2280 и переходник, который позволяет устанавливать его в любой обычный слот PCIe x4 (или более скоростной). В его же основе лежит восьмиканальный контроллер Marvell 88SS9183, общающийся с внешним миром по двум линиям PCI Express 2.0. Так же, как и в прошлой модификации, в M6e Black Edition используется MLC-флеш-память компании Toshiba.

И это значит, что несмотря на то, что M6e Black Edition в сборе выглядит как карта половинной высоты с интерфейсом PCI Express x4, на самом деле этот SSD пользуется лишь двумя линиями PCI Express 2.0. Отсюда и не слишком впечатляющие скорости, которое лишь немного превышают быстродействие традиционных SATA SSD. Паспортная производительность на последовательных операциях ограничивается величиной 770 Мбайт/с, а на произвольных – 105 тысяч IOPS. Стоит отметить, что работает Plextor M6e Black Edition по наследственному AHCI-протоколу, и это обеспечивает его широкую совместимость с различными системами.



Несмотря на то, что Plextor M6e Black Edition, как и Kingston HyperX Predator, представляет собой комбинацию из PCI Express переходника и «ядра» в формате M.2-платы, с лицевой стороны определить это невозможно. Весь накопитель спрятался под фигурным чёрным алюминиевым кожухом, в центре которого врезан красный радиатор, который должен отводить тепло от контроллера и чипов памяти. Расчёт дизайнеров понятен: подобное цветовое решение повсеместно применяется в различном игровом железе, поэтому Plextor M6e Black Edition будет гармонично смотреться рядом со многими геймерскими материнскими платами и видеокартами большинства ведущих производителей.



Массив флеш-памяти в Plextor M6e Black Edition набран 19-нм чипами MLC NAND компании Toshiba второго поколения с ёмкостью 64 Гбит. На резерв, используемый для подменного фонда и работы внутренних алгоритмов выравнивания износа и сборки мусора отведено 7 процентов от общего объёма. Всё остальное – доступно пользователю.



Из-за использования достаточно слабого контроллера Marvell 88SS9183 с внешней шиной PCI Express 2.0 x2 накопитель Plextor M6e Black Edition стоит считать достаточно медленным PCIe SSD. Однако это не мешает производителю относить этот продукт в верхнюю ценовую категорию. С одной стороны, он всё-таки быстрее SATA SSD, а с другой – обладает неплохими характеристиками надёжности: имеет продолжительное время наработки на отказ и покрывается пятилетней гарантией. Впрочем, никаких специальных технологий, способных защитить M6e Black Edition от перепадов напряжения или увеличить его ресурс, в нём не реализовано.

Samsung SM951 256 Гбайт

Samsung SM951 – самый неуловимый накопитель в сегодняшнем тестировании. Дело в том, что изначально это – продукт для сборщиков компьютеров, поэтому в розничной продаже он представлен достаточно блекло. Тем не менее, при желании, купить его всё-таки возможно, поэтому отказываться от рассмотрения SM951 мы не стали. Тем более, если судить по характеристикам, это – весьма быстродействующая модель. Она ориентирована на работу по шине PCI Express 3.0 x4, использует протокол AHCI и обещает впечатляющие скорости: до 2150 Мбайт/с на последовательных операциях и до 90 тысяч IOPS – на произвольных. Но самое главное, при всём при этом Samsung SM951 дешевле многих прочих PCIe SSD, так что его поиски в продаже могут иметь под собой вполне конкретное экономическое обоснование.

Ещё одна особенность Samsung SM951 заключается в том, что поставляется он в M.2-виде. Изначально это решение ориентировано на мобильные системы, поэтому никаких переходников для полноразмерных слотов PCIe в комплекте с накопителем не прилагается. Тем не менее, это вряд ли можно считать серьёзным недостатком – большинство флагманских материнских плат имеют на своём борту и интерфейсные слоты M.2. Кроме того, необходимые платы-переходники широко представлены в продаже. Сам же Samsung SM951 представляет собой плату форм-фактора M.2 2280, разъём которой имеет ключ типа M, указывающий на потребность SSD в четырёх линиях PCI Express.



В основе Samsung SM951 лежит исключительно мощный контроллер Samsung UBX, разработанный производителем специально для SSD c интерфейсом PCI Express. Он базируется на трёх ядрах с ARM-архитектурой и в теории способен работать как c AHCI-, так и с NVMe-командами. В рассматриваемом SSD в контроллере включён лишь AHCI-режим. Но NVMe-версию данного контроллера в скором времени можно будет увидеть в новом потребительском SSD, который Samsung должен запустить этой осенью.



Из-за OEM-направленности для рассматриваемого накопителя не сообщается ни сроков гарантии, ни прогнозируемой выносливости. Декларировать эти параметры должны сборщики систем, в которые будет установлен SM951, либо продавцы. Однако следует отметить, что трёхмерная V-NAND, которая сейчас активно продвигается Samsung в потребительских SSD как более быстродействующая и надёжная разновидность флеш-памяти, в SM951 не используется. Вместо этого в нём применена обычная планарная Toggle Mode 2.0 MLC NAND, производимая, предположительно, по 16-нм технологии (некоторые источники предполагают 19-нм техпроцесс). Это означает, что ожидать от SM951 столь же высокой выносливости, как у флагманского SATA-накопителя 850 PRO, явно не следует. По этому параметру SM951 ближе к обычным моделям среднего уровня, к тому же на резервирование в этом SSD отводится только 7 процентов от массива флеш-памяти. Нет в Samsung SM951 и каких-то особых технологий серверного уровня для защиты данных от сбоев питания. Иными словами, акцент в этой модели сделан исключительно на скорости работы, а всё остальное отсечено для снижения стоимости.



Стоит отметить и ещё один момент. При высокой нагрузке Samsung SM951 демонстрирует достаточно серьёзный нагрев, который в конечном итоге может даже приводить ко включению троттлинга. Поэтому в высокопроизводительных системах для SM951 желательно организовать как минимум обдув, а лучше – закрыть его радиатором.

Сравнительные характеристики протестированных SSD


Вопросы совместимости

Как и всякая новая технология, твердотельные накопители с интерфейсом PCI Express пока не могут похвастать 100-процентной беспроблемной работоспособностью с любыми платформами, особенно старыми. Поэтому выбирать подходящий SSD приходится не только исходя из потребительских характеристик, но и с оглядкой на совместимость. И здесь важно иметь в виду два момента.

В первую очередь, разные SSD могут использовать разное количество линий PCI Express и разные поколения этой шины - 2.0 или 3.0. Поэтому перед покупкой PCIe накопителя нужно убедиться в том, что в системе, куда его планируется установить, есть свободный слот с нужной полосой пропускания. Конечно, более скоростные PCIe SSD имеют обратную совместимость с медленными слотами, однако в этом случае приобретение высокоскоростного SSD имеет не слишком много смысла – он попросту не сможет раскрыть весь заложенный в него потенциал.

Наиболее широкой совместимостью в этом смысле обладает Plextor M6e Black Edition – он требует всего две линии PCI Express 2.0, и такой свободный слот наверняка найдётся на практически любой материнской плате. Для Kingston HyperX Predator нужно уже четыре линии PCI Express 2.0: такие слоты PCIe тоже есть на многих платах, но некоторые дешёвые платформы лишними слотами с числом линий PCI Express четыре или более могут и не обладать. Особенно это касается материнок, построенных на чипсетах нижнего уровня, общее число линий у которых может быть урезано до шести. Поэтому перед приобретением Kingston HyperX Predator обязательно проверьте, что в системе есть свободный слот с четырьмя или большим числом линий PCI Express.

OCZ Revodrive 350 задаёт задачку посложнее – ему уже требуется восемь линий PCI Express. Такие слоты обычно реализуются уже силами не чипсета, а процессора. Поэтому оптимальным местом применения такого накопителя являются LGA 2011/2011-3-платформы, где PCI Express контроллер процессора располагает избыточным числом линий, позволяющим обслуживать более чем одну видеокарту. В системах же с LGA 1155/1150/1151-процессорами OCZ Revodrive 350 будет уместен лишь в том случае, если используется встроенная в CPU графика. В противном случае в пользу твердотельного накопителя придётся отнять половину линий у GPU, переведя его в режим PCI Express x8.

Intel SSD 750 и Samsung SM951 в чём-то похожи на OCZ Revodrive 350: их тоже предпочтительнее использовать в слотах PCI Express, питаемых от процессора. Однако причина тут не в количестве линий – им требуется всего четыре линии PCI Express, а в поколении этого интерфейса: оба эти накопителя способны задействовать увеличенную пропускную способность PCI Express 3.0. Однако есть и исключение: новейшие интеловские наборы системной логики сотой серии, предназначенные для процессоров семейства Skylake, получили поддержку PCI Express 3.0, поэтому в новейших LGA 1151-платах их без зазрений совести можно устанавливать и в чипсетные PCIe-слоты, к которым подведено как минимум четыре линии.

У проблемы совместимости есть и вторая часть. Ко всем ограничениям, связанным с пропускной способностью различных вариаций слотов PCI Express добавляются ещё и ограничения, связанные с используемыми протоколами. Наиболее беспроблемными в этом смысле являются SSD, которые работают через AHCI. Благодаря тому, что в них эмулируется поведение обычного SATA-контроллера, они могут работать с любыми, даже старыми, платформами: они видятся в BIOS любых материнских плат, могут быть загрузочными дисками, а для их работы в операционной системе не требуется и никаких дополнительных драйверов. Иными словами, Kingston HyperX Predator и Plextor M6e Black Edition – это два самых беспроблемных PCIe SSD.

А что же другая пара AHCI-накопителей? С ними ситуация немного сложнее. OCZ Revodrive 350 работает в операционной системе через собственный драйвер, но даже несмотря на это проблем с тем, чтобы сделать этот накопитель загрузочным, нет никаких. Хуже дело обстоит с Samsung SM951. Хотя этот SSD и общается с системой посредством наследственного протокола AHCI, он лишён собственного BIOS, и поэтому его инициализацию должен проводить BIOS материнской платы. К сожалению, поддержка данного SSD есть далеко не во всех материнках, в особенности старых. Поэтому с полной уверенностью можно говорить лишь о его совместимости с платами на базе последних интеловских чипсетов девяностой и сотой серии. В остальных случаях он может попросту не видеться материнской платой. Конечно, это не помешает использовать Samsung SM951 в операционной системе, где его легко инициализирует AHCI-драйвер, но в таком случае о возможности загрузки со скоростного SSD придётся забыть.

Но самые большие неудобства способен причинить Intel SSD 750, работающий через новый интерфейс NVMe. Драйверы, которые необходимы для поддержки твердотельных накопителей, работающих по этому протоколу, присутствуют только в новейших операционных системах. Так, в Linux поддержка NVMe появилась в версии ядра 3.1; «врождённый» драйвер NVMe имеется в микрософтовских системах, начиная с Windows 8.1 и Windows Server 2012 R2; а в OS X совместимость с NVMe-накопителями была добавлена в версии 10.10.3. Кроме того, NVMe SSD поддерживается далеко не всеми материнскими платами. Для того чтобы такие накопители можно было использовать в качестве загрузочных, BIOS материнской платы должен тоже располагать соответствующим драйвером. Однако производители встроили необходимую функциональность лишь в самые последние версии прошивок, выпущенные для наиболее свежих моделей материнок. Поэтому поддержка загрузки операционной системы с NVMe-накопителей есть лишь на самых современных платах для энтузиастов, основанных на наборах логики Intel Z97, Z170 и X99. В более старых и дешёвых платформах пользователи смогут воспользоваться NVMe SSD лишь как вторыми дисками в ограниченном наборе ОС.

Несмотря на то, что мы постарались описать все возможные комбинации платформ и PCI Express накопителей, основной вывод из сказанного таков: совместимость PCIe SSD с материнскими платами – вопрос далеко не такой очевидный, как в случае с SATA SSD. Поэтому перед приобретением любого высокоскоростного твердотельного накопителя, работающего через PCI Express, обязательно уточните его совместимость с конкретной материнской платой на сайте производителя.

Тестовая конфигурация, инструментарий и методика тестирования

Тестирование проводится в операционной системе Microsoft Windows 8.1 Professional x64 with Update, корректно распознающей и обслуживающей современные твердотельные накопители. Это значит, что в процессе прохождения тестов, как и при обычном повседневном использовании SSD, команда TRIM поддерживается и активно задействуется. Измерение производительности выполняется с накопителями, находящимися в «использованном» состоянии, которое достигается их предварительным заполнением данными. Перед каждым тестом накопители очищаются и обслуживаются с помощью команды TRIM. Между отдельными тестами выдерживается 15-минутная пауза, отведённая для корректной отработки технологии сборки мусора. Во всех тестах, если не указано иное, используются рандомизированные несжимаемые данные.

Используемые приложения и тесты:

Iometer 1.1.0

Измерение скорости последовательного чтения и записи данных блоками по 256 Кбайт (наиболее типичный размер блока при последовательных операциях в десктопных задачах). Оценка скоростей выполняется в течение минуты, после чего вычисляется средний показатель.
Измерение скорости случайного чтения и записи блоками размером 4 Кбайт (такой размер блока используется в подавляющем большинстве реальных операций). Тест проводится дважды - без очереди запросов и с очередью запросов глубиной 4 команды (типичной для десктопных приложений, активно работающих с разветвлённой файловой системой). Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Установление зависимости скоростей случайного чтения и записи при работе накопителя с 4-килобайтными блоками от глубины очереди запросов (в пределах от одной до 32 команд). Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Установление зависимости скоростей случайного чтения и записи при работе накопителя с блоками разного размера. Используются блоки объёмом от 512 байт до 256 Кбайт. Глубина очереди запросов в течение теста составляет 4 команды. Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Измерение производительности при смешанной многопоточной нагрузке и установление её зависимости от соотношения между операциями чтения и записи. Тест проводится дважды: для последовательных чтений и записей блоками объёмом 128 Кбайт, выполняемыми в два независимых потока и для случайных операций с блоками объёмом 4 Кбайт, которые выполняются в четыре потока. В обоих случаях соотношение между операциями чтения и записи варьируется с шагом 20 процентов. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Исследование падения производительности SSD при обработке непрерывного потока операций случайной записи. Используются блоки размером 4 Кбайт и глубина очереди 32 команды. Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Продолжительность теста составляет два часа, измерения моментальной скорости проводятся ежесекундно. По окончании теста дополнительно проверяется способность накопителя восстанавливать свою производительность до первоначальных величин за счёт работы технологии сборки мусора и после отработки команды TRIM.

CrystalDiskMark 5.0.2
Синтетический тест, выдающий типовые показатели производительности твердотельных накопителей, измеренные на 1-гигабайтной области диска «поверх» файловой системы. Из всего набора параметров, которые можно оценить с помощью этой утилиты, мы обращаем внимание на скорость последовательного чтения и записи, а также на производительность произвольных чтения и записи 4-килобайтными блоками без очереди запросов и с очередью глубиной 32 команды.
PCMark 8 2.0
Тест, основанный на эмулировании реальной дисковой нагрузки, которая характерна для различных популярных приложений. На тестируемом накопителе создаётся единственный раздел в файловой системе NTFS на весь доступный объём, и в PCMark 8 проводится тест Secondary Storage. В качестве результатов теста учитывается как итоговая производительность, так и скорость выполнения отдельных тестовых трасс, сформированных различными приложениями.
Тесты копирования файлов
В этом тесте измеряется скорость копирования директорий с файлами разного типа, а также скорость архивации и разархивации файлов внутри накопителя. Для копирования используется стандартное средство Windows – утилита Robocopy, при архивации и разархивации – архиватор 7-zip версии 9.22 beta. В тестах участвует три набора файлов: ISO – набор, включающий несколько образов дисков c дистрибутивами программ; Program – набор, представляющий собой предустановленный программный пакет; Work – набор рабочих файлов, включающий офисные документы, фотографии и иллюстрации, pdf-файлы и мультимедийный контент. Каждый из наборов имеет общий объём файлов 8 Гбайт.

В качестве тестовой платформы используется компьютер с материнской платой ASUS Z97-Pro, процессором Core i5-4690K со встроенным графическим ядром Intel HD Graphics 4600 и 16 Гбайт DDR3-2133 SDRAM. Диски с SATA-интерфейсом подключается к контроллеру SATA 6 Гбит/с, встроенному в чипсет материнской платы, и работают в режиме AHCI. Накопители с интерфейсом PCI Express устанавливаются в первый полноскоростной слот PCI Express 3.0 x16. Используется драйверы Intel Rapid Storage Technology (RST) 13.5.2.1000 и Intel Windows NVMe driver 1.2.0.1002.

Объём и скорость передачи данных в бенчмарках указываются в бинарных единицах (1 Кбайт = 1024 байт).

Помимо пяти главных героев этого теста – клиентских твердотельных накопителей с интерфейсом PCI Express, мы добавили к ним в компанию и самый быстрый SATA SSD – Samsung 850 PRO.

В результате, список протестированных моделей приобрёл следующий вид:

Intel SSD 750 400 Гбайт (SSDPEDMW400G4, прошивка 8EV10135);
Kingston HyperX Predator PCIe 480 Гбайт (SHPM2280P2H/480G, прошивка OC34L5TA);
OCZ RevoDrive 350 480 Гбайт (RVD350-FHPX28-480G, прошивка 2.50);
Plextor M6e Black Edition 256 Гбайт (PX-256M6e-BK, прошивка 1.05);
Samsung 850 Pro 256 Гбайт (MZ-7KE256, прошивка EXM01B6Q);
Samsung SM951 256 Гбайт (MZHPV256HDGL-00000, прошивка BXW2500Q).

Производительность

Последовательные операции чтения и записи






Новое поколение твердотельных накопителей, переведённых на шину PCI Express, должно в первую очередь выделяться высокими скоростями последовательного чтения и записи. И именно это мы видим на графике. Все PCIe SSD оказываются производительнее лучшего SATA SSD – Samsung 850 PRO. Однако даже такая простая нагрузка как последовательное чтение и запись показывает огромные различия между SSD различных производителей. Причём, вариант используемой шины PCI Express не имеет определяющего значения. Лучшую производительность здесь может выдать PCI Express 3.0 x4 накопитель Samsung SM951, а на втором месте – Kingston HyperX Predator, работающий через PCI Express 2.0 x4. Прогрессивный же NVMe-накопитель Intel SSD 750 оказался лишь на третьем месте.

Случайные операции чтения






Если же говорить о случайном чтении, то как видно из диаграмм, PCIe SSD не особенно отличаются по скорости от традиционных SATA SSD. Причём, это касается не только AHCI-накопителей, но и того продукта, который работает с протоком NVMe. Фактически лучшую, чем Samsung 850 PRO производительность при случайных операциях чтения на небольших очередях запросов могут продемонстрировать лишь три участника этого теста: Samsung SM951, Intel SSD 750 и Kingston HyperX Predator.

Несмотря на то, что операции с глубокой очередью запросов для персональных компьютеров не свойственны, мы всё же посмотрим, как зависит производительность рассматриваемого SSD от глубины очереди запросов при чтении 4-килобайтных блоков.



По графику хорошо видно, насколько решения, работающие через PCI Express 3.0 x4, могут превосходить все другие SSD. Кривые, соответствующие Samsung SM951 и Intel SSD 750 находятся существенно выше графиков других накопителей. По приведённой диаграмме можно сделать и ещё одно заключение: OCZ RevoDrive 350 – это позорно медленный твердотельный накопитель. На случайных операциях чтения он где-то вдвое отстаёт от SATA SSD, что обусловлено его RAID-архитектурой и использованием устаревших контроллеров SandForce второго поколения.

В дополнение к этому предлагаем посмотреть, как зависит скорость случайного чтения от размера блока данных:



Здесь картина немного иная. С ростом размера блоков операции начинают походить на последовательные, поэтому роль начинает играть не только архитектура и мощность контроллера SSD, но и пропускная способность используемой ими шины. На блоках больших размеров лучшую производительность обеспечивают Samsung SM951, Intel SSD 750 и Kingston HyperX Predator.

Случайные операции записи






Где-то преимущества интерфейса NVMe, обеспечивающего низкие латентности, и контроллера Intel SSD 750 с высоким уровнем параллелизма должны были проявиться. К тому же имеющийся в этом SSD вместительный DRAM-буфер позволяет организовать очень эффективное кеширование данных. И в результате Intel SSD 750 выдаёт непревзойдённую скорость произвольной записи даже в том случае, если очередь запросов имеет минимальную глубину.

Более явно увидеть, что происходит с производительностью случайной записи при увеличении глубины очереди запросов, можно на следующем графике, показывающем зависимость скорости произвольной записи 4-килобайтными блоками от глубины очереди запросов:



Масштабирование производительности Intel SSD 750 происходит до тех пор, пока глубина очереди не достигнет 8 команд. Это – типичное поведение для потребительских SSD. Однако новинка Intel отличается тем, что её скорости при случайной записи значительно выше, чем у любых других твердотельных накопителей, в том числе и у быстрейших PCIe-моделей вроде Samsung SM951 или Kingston HyperX Predator. Иными словами, при случайной нагрузке в виде записи данных Intel SSD 750 предлагает принципиально лучшую производительность, чем любые другие SSD. Иными словами, переход на использование интерфейса NVMe позволяет прокачать скорость случайной записи. И это – безусловно важная характеристика, но в первую очередь для серверных накопителей. Собственно, Intel SSD 750 как раз и является близким родственником таких моделей как Intel DC P3500, P3600 и P3700.

Следующий график отражает зависимость производительности случайных записей от размера блока данных.



По мере увеличения размеров блоков Intel SSD 750 теряет своё безоговорочное преимущество. Примерно такую же производительность начинают выдавать Samsung SM951 и Kingston HyperX Predator.


По мере удешевления твердотельные накопители перестают использоваться в качестве исключительно системных и становятся обычными рабочими дисками. В таких ситуациях на SSD поступает не только рафинированная нагрузка в виде записи или чтения, но и смешанные запросы, когда операции чтения и записи инициируются разными приложениями и должны обрабатываться одновременно. Однако работа в дуплексном режиме для современных контроллеров SSD остаётся существенной проблемой. При смешивании операций чтения и записи в одной очереди скорость большинства твердотельных накопителей потребительского уровня заметно проседает. Это стало поводом для проведения отдельного исследования, в рамках которого мы проверяем, как работают SSD при необходимости обработки последовательных операций, поступающих вперемежку. Следующая пара диаграмм демонстрирует наиболее характерный для десктопов случай, когда соотношение количества операций чтения и записи составляет 4 к 1.






При последовательной смешанной нагрузке с преобладающими операциями чтения, что характерно для обычных персональных компьютеров, наилучшую производительность выдают Samsung SM951 и Kingston HyperX Predator. Случайная смешанная нагрузка оказывается более тяжёлым испытанием для SSD и оставляет в лидерах Samsung SM951, но на второе место выдвигает Intel SSD 750. При этом Plextor M6e Black Edition, Kingston HyperX Predator и OCZ RevoDrive 350 вообще оказываются заметно хуже обычного SATA SSD.

Следующая пара графиков даёт более развёрнутую картину производительности при смешанной нагрузке, показывая зависимость скорости SSD от того, в каком соотношении приходят на него операции чтения и записи.






Всё сказанное выше хорошо подтверждается и на приведённых графиках. При смешанной нагрузке с последовательными операциями лучшее быстродействие показывает Samsung SM951, который чувствует себя как рыба в воде при любой работе с последовательными данными. При произвольных смешанных операциях ситуация немного отличается. Оба накопителя компании Samsung, и работающий через PCI Express 3.0 x4 SM951, и обычный SATA 850 PRO, в этом тесте выдают очень хорошие результаты, обходя по производительности почти все остальные SSD. Противостоять им в отдельных случаях может лишь Intel SSD 750, который благодаря системе команд NVMe отлично оптимизирован под работу со случайными записями. И когда в потоке смешанных операций доля записей возрастает до 80 процентов или выше, он резко вырывается вперёд.

Результаты в CrystalDiskMark

CrystalDiskMark - это популярное и простое тестовое приложение, работающее «поверх» файловой системы, которое позволяет получать результаты, легко повторяемые обычными пользователями. Полученные в нём показатели производительности должны дополнить подробные графики, построенные нами на основании тестов в IOMeter.












Приведённые четыре диаграммы представляют лишь теоретическую ценность, показывая пиковую производительность, не достижимую в типичных клиентских задачах. Глубины очереди запросов в 32 команды в персональных компьютерах никогда не бывает, но в специальных тестах она позволяет получить максимальные показатели производительности. И в этом случае лидирующее быстродействие с большим отрывом выдаёт Intel SSD 750, который имеет архитектуру, унаследованную от серверных накопителей, где большая глубина очереди запросов – вполне в порядке вещей.












А вот эти четыре диаграммы представляют уже практический интерес – на них отображена производительность при нагрузке, которая характерна для персональных компьютеров. И здесь лучшую производительность выдаёт уже Samsung SM951, который отстаёт от Intel SSD 750 лишь при случайных 4-килобайтных записях.

PCMark 8 2.0, реальные сценарии использования

Тестовый пакет Futuremark PCMark 8 2.0 интересен тем, что он имеет не синтетическую природу, а напротив - основывается на том, как работают реальные приложения. В процессе его прохождения воспроизводятся настоящие сценарии-трассы задействования диска в распространённых десктопных задачах, и замеряется скорость их выполнения. Текущая версия этого теста моделирует нагрузку, которая взята из реальных игровых приложений Battlefield 3 и World of Warcraft и программных пакетов компаний Abobe и Microsoft: After Effects, Illustrator, InDesign, Photoshop, Excel, PowerPoint и Word. Итоговый результат исчисляется в виде усреднённой скорости, которую показывают накопители при прохождении тестовых трасс.



Тест PCMark 8 2.0, оценивающий производительность систем хранения данных в реальных приложениях, недвусмысленно говорит нам о том, что существует лишь два PCIe-накопителя, скорость которых принципиально выше, чем у привычных моделей с SATA-интерфейсом. Это - Samsung SM951 и Intel SSD 750, которые побеждают и во многих других тестах. Другие же PCIe SSD, например, Plextor M6e Black Edition и Kingston HyperX Predator отстают от лидеров более чем в полтора раза. Ну а OCZ ReveDrive 350 демонстрирует откровенно плохое быстродействие. Он медленнее лучших PCIe SSD более чем вдвое и при этом уступает по скорости даже Samsung 850 PRO, который работает через SATA-интерфейс.

Интегральный результат PCMark 8 нужно дополнить и показателями производительности, выдаваемыми флеш-дисками при прохождении отдельных тестовых трасс, которые моделируют различные варианты реальной нагрузки. Дело в том, что при разной нагрузке флеш-приводы зачастую ведут себя немного по-разному.






























О каком бы приложении ни шла речь, в любом случае наивысшую производительность выдаёт один из SSD с интерфейсом PCI Express 3.0 x4: либо Samsung SM951, либо Intel SSD 750. Что интересно, остальные PCIe SSD в ряде случаев вообще выдают скорость лишь на уровне SATA SSD. Фактически, преимущество тех же Kingston HyperX Predator и Plextor M6e Black Edition над Samsung 850 PRO можно увидеть лишь в Adobe Photoshop, Battlefield 3 и Microsoft Word.

Копирование файлов

Имея в виду, что твердотельные накопители внедряются в персональные компьютеры всё шире и шире, мы решили добавить в нашу методику измерение производительности при обычных файловых операциях – при копировании и работе с архиваторами – которые выполняются «внутри» накопителя. Это – типичная дисковая активность, возникающая в том случае, если SSD исполняет роль не системного накопителя, а обычного диска.









В тестах копирования в лидерах оказываются всё те же Samsung SM951 и Intel SSD 750. Однако если речь идёт о больших последовательных файлах, то конкуренцию им может составить Kingston HyperX Predator. Надо сказать, что при простом копировании почти все PCIe SSD оказываются быстрее Samsung 850 PRO. Исключение лишь одно – Plextor M6e Black Edition. А OCZ RevoDrive 350, который в остальных тестах стабильно оказывался в положении безнадёжного аутсайдера, неожиданно обходит не только SATA SSD, но и самого медленного PCIe SSD.

Вторая группа тестов проведена при архивации и разархивации директории с рабочими файлами. Принципиальное отличие этого случая заключается в том, что половина операций выполняется с разрозненными файлами, а вторая половина – с одним большим файлом архива.






Похожая ситуация и при работе с архивами. Отличие лишь в том, что тут Samsung SM951 удаётся уверенно оторваться от всех конкурентов.

Работа TRIM и фоновой сборки мусора

Испытывая различные твердотельные накопители, мы всегда проверяем то, как они отрабатывают команду TRIM и способны ли они собирать мусор и восстанавливать свою производительность без поддержки со стороны операционной системы, то есть в такой ситуации, когда команда TRIM не передаётся. Такое тестирование было проведено и в этот раз. Схема этого испытания стандартна: после создания длительной непрерывной нагрузки на запись данных, которая приводит к деградации скорости записи, мы отключаем поддержку TRIM и выжидаем 15 минут, в течение которых SSD может попытаться самостоятельно восстановиться за счёт собственного алгоритма сборки мусора, но без помощи со стороны операционной системы, и замеряем скорость. Затем на накопитель принудительно подаётся команда TRIM - и после небольшой паузы скорость измеряется ещё раз.

Результаты такого тестирования приведены в следующей таблице, где для каждой протестированной модели указано, реагирует ли она на TRIM очисткой неиспользуемой части флеш-памяти и может ли она заготавливать чистые страницы флеш-памяти под будущие операции, если команда TRIM на неё не подаётся. Для накопителей, которые оказались способны осуществлять сборку мусора и без команды TRIM, мы также указали тот объём флеш-памяти, который был самостоятельно освобождён контроллером SSD под будущие операции. Для случая эксплуатации накопителя в среде без поддержки TRIM это - как раз тот объём данных, который можно будет сохранить на накопитель с высокой первоначальной скоростью после простоя.



Несмотря на то, что качественная поддержка команды TRIM стала отраслевым стандартом, некоторые производители считают допустимым продавать накопители, в которых эта команда не отрабатывается в полной мере. Такой отрицательный пример демонстрирует OCZ Revodrive 350. Формально TRIM он понимает, и даже что-то пытается сделать при получении этой команды, но о полном возвращении скорости записи к первоначальным значениям говорить не приходится. И в этом нет ничего странного: в основе Revodrive 350 лежат контроллеры SandForce, которые отличаются своей необратимой деградаций производительности. Соответственно присутствует она и в Revodrive 350.

Все же остальные PCIe SSD работают с TRIM как и их SATA-собратья. То есть, идеально: в операционных системах, которые подают эту команду на накопители, производительность остаётся на неизменно высоком уровне.

Однако мы хотим большего – качественный накопитель должен уметь проводить сборку мусора и без подачи команды TRIM. И здесь выделяется Plextor M6e Black Edition – накопитель, который способен самостоятельно освободить под предстоящие операции значительно больше флеш-памяти, чем его конкуренты. Хотя, конечно, в той или иной мере автономная сборка мусора работает у всех протестированных нами SSD, за исключением Samsung SM951. Иными словами, при обычном использовании в современных средах производительность Samsung SM951 деградировать не будет, однако в тех случаях, когда TRIM не поддерживается, применять этот SSD не рекомендуется.

Выводы

Начать подводить итоги, наверное, следует с констатации факта, что потребительские SSD с интерфейсом PCI Express – это уже не экзотика и не какие-то экспериментальные продукты, а целый рыночный сегмент, в котором играют наиболее быстродействующие твердотельные накопители для энтузиастов. Естественно, это же и означает, что с PCIe SSD уже давно нет никаких проблем: они поддерживают все функции, что есть в SATA SSD, но при этом более производительны и порой обладают некоторыми новыми интересными технологиями.

В то же время рынок клиентских PCIe SSD не столь переполнен, и войти в когорту производителей таких твердотельных накопителей пока смогли лишь компании, обладающие высоким инженерным потенциалом. Это связано с тем, что у независимых разработчиков массовых контроллеров SSD пока нет решений-конструкторов, позволяющих приступить к выпуску PCIe-накопителей с минимальными инженерными усилиями. Поэтому каждый из представленных в настоящее время на полках магазинов PCIe SSD по-своему самобытен и уникален.

В этом тестировании нам удалось собрать вместе пять самых популярных и наиболее распространённых PCIe SSD, ориентированных на эксплуатацию в составе персональных компьютеров. И по результатам знакомства с ними становится понятно, что покупателям, желающим перейти на пользование твердотельными накопителями с прогрессивным интерфейсом, никакие серьёзные муки выбора пока не грозят. В большинстве случаев выбор будет однозначным, настолько сильно отличаются по своим потребительским качествам протестированные модели.

В целом, наиболее привлекательной моделью PCIe SSD оказался Samsung SM951 . Это – блестящее решение от одного из лидеров рынка, работающее через шину PCI Express 3.0 x4, которое не только оказалось способно обеспечить наивысшую производительность в типичных общеупотребительных нагрузках, но и к тому же заметно дешевле всех остальных PCIe-накопителей.

Однако Samsung SM951 всё же не идеален. Во-первых, в нём нет никаких специальных технологий, ориентированных на повышение надёжности, а в продуктах премиального уровня их всё-таки хотелось бы иметь. Во-вторых, этот SSD достаточно тяжело найти в продаже в России – по официальным каналам он в нашу страну не поставляется. К счастью, мы можем предложить обратить внимание и на неплохую альтернативу – Intel SSD 750 . Этот SSD тоже работает через PCI Express 3.0 x4, и всего лишь немного отстаёт от Samsung SM951. Зато он является прямым родственником серверных моделей, а потому имеет высокую надёжность и работает по протоколу NVMe, что позволяет ему демонстрировать непревзойдённую скорость на операциях случайной записи.

В принципе, на фоне Samsung SM951 и Intel SSD 750 остальные SSD с интерфейсом PCIe смотрятся достаточно слабо. Однако всё-таки существуют ситуации, когда предпочесть им придётся какую-то другую модель PCIe SSD. Дело в том, что передовые накопители Samsung и Intel совместимы лишь с современными материнскими платами, построенными на интеловских чипсетах девяностой или сотой серии. В более же старых системах они способны работать лишь в роли «второго диска», а загрузка с них операционной системы окажется невозможной. Поэтому для модернизации платформ прошлых поколений ни Samsung SM951, ни Intel SSD 750 не подойдут, и выбор придётся остановить на накопителе Kingston HyperX Predator , который с одной стороны может обеспечить неплохую производительность, а с другой – гарантированно не имеет никаких проблем совместимости со старыми платформами.

Коротко об истории...

Впервые отдельный интерфейс, призванный стать заменой шины PCI для видеокарт, был представлен в 1997 году. AGP (от англ. Accelerated Graphics Port, ускоренный графический порт) - именно так представила свою новую разработку компания Intel одновременно с официальным анонсом чипсета для процессоров Intel Pentium II.

Заявленные преимущества AGP перед его предшественником PCI были существенны:

  • более высокая частота работы (66 МГц);
  • увеличенная пропускная способность между видеокартой и системной шиной;
  • прямая передача информации между видеокартой и оперативной памятью, минуя процессор;
  • улучшенная система питания;
  • высокоскоростной доступ к общей памяти.

Должного развития стандарт AGP 1x (спецификация AGP 1.0) не получил из-за низкой скорости работы с памятью и был практически сразу же усовершенствован, а его скорость удвоена - так появился интерфейс AGP 2x. Передавая за один такт 32 бита (4 байта), порт AGP 2x мог выдавать невиданную по тем временам пиковую производительность 66.6х4х2=533 М B / s .

В 1998 году увидел свет стандарт AGP 4x (спецификация AGP 2.0), обеспечивающий передачу до 4 блоков информации за один такт. При этом сигнальное напряжение порта было понижено с 3.3 до 1.5 В. Максимальная пропускная способность AGP 4x стала около 1 GB / s . В дальнейшем развитие спецификаций носило затяжной характер - причиной тому послужила весьма низкая скорость существовавшего на тот момент парка видеоускорителей, а также низкая скорость обмена с оперативной памятью.

Как только технический прогресс "уперся" в шину, которая оказалась слишком мала для передачи огромных потоков информации современными видеокартами, был утвержден новый стандарт - AGP 8x (спецификация AGP 3.0). Как вы уже догадались, он может передавать до 8 блоков информации за один такт и обладает пиковой пропускной способностью 2 GB / s . Шина AGP 8x имеет обратную совместимость с AGP 4x.

Отрасль высоких технологий всегда идет стремительно ввысь. Наращиваются объемы передаваемых и пропускаемых данных, растут текстуры и их качество, все это непременно заставляет каждого из производителей устраивать себе встряску и выдавать "на-гора" что-нибудь новенькое и высокотехнологичное (стандарт, спецификации, протокол, интерфейс), который свяжет с собой новый виток в сфере hi - tech .

Официально первая базовая спецификация PCI Express появилась в июле 2002 года, тем самым был ознаменован день постепенного "ухода из жизни" AGP 8x…

Введение

На данный момент современный набор логики Intel P45/X48 имеет официальную поддержку спецификаций PCI Express 2.0, чем не мог похвастаться весьма распространенный Intel P35. Для тех, кто еще только собирается приобрести современную плату на платформе Intel, выбор остается вполне очевидным - чипсет P45/X48, и у вас не возникнет дилеммы "хватит или не хватит" PCI Express 1.1 для нынешней hi-end или middle-end видеокарты. А как же быть владельцам P35-ых? Стоит ли снова бежать в магазин?

В нашем сегодняшнем материале мы попытаемся расставить все точки над "I" касательно преимуществ PCI-E 2.0 над PCI-E 1.1 для современных ускорителей. Также экспериментальным путем мы проанализируем производительность видеокарт при работе с различными интерфейсами, на основе чего и будет сделан вывод о практической ценности PCI-E 2.0.

И перед тем, как приступить к каким-либо объективным тестам, давайте немного углубимся в теорию, а именно разберемся, как вообще это все работает.

PCI - Express - коротко о главном

Как уже упоминалось выше, базовая спецификация PCI Express появилась в июле 2002 года. Благодаря высокой скорости и пиковой производительности шина PCI Express не оставляет шансов своему предшественнику AGP. По своей программной модели новый интерфейс PCI-E во многом аналогичен PCI, что позволяет легко адаптировать нынешний парк всевозможных устройств к новому интерфейсу без значительных софтверных "подгонок".

Принцип работы PCI Express основан на последовательной передаче данных. Шина представляет собой пакетную сеть с топологией типа "звезда". При взаимодействии PCI-E устройств используется двунаправленное соединение типа "точка-точка", получившее название "Line" (линия). Каждое соединение PCI Express может состоять из одной (1х) или множества линий (4х, 16х и т.д).

Для базовой конфигурации PCI-Express 1х теоретическая пропускная способность составляет 250 MB/s в каждом направлении (передача/прием). Соответственно, для PCI-E x16 это значение равно 250 MB/s х 16 = 4 GB/s.

Примечателен тот факт, что с физической стороны интерфейс позволяет, например, любой плате с интерфейсом PCI-E 1х уверенно работать не только в штатном, но и в любом другом слоте PCI Express большей пропускной способности (4х, 16х и т.д.). При этом максимальное количество задействованных линий зависит только от свойств устройства.

Во всех высокоскоростных протоколах всегда остро встает вопрос помехозащищенности. На этот счет в PCI Express используется уже давно известная схема 8/10 или избыточного трафика (8 бит данных, передаваемых по каналу, заменяются на 10 бит, таким образом, генерируется дополнительная информация, около 20% от общего "потока").

PCI Express 2.0

Стандарт был официально утвержден 15 января 2007 года. Во второй ревизии PCI Express значительно увеличилась пропускная способность одного канала - до 5 Gb/s (PCI Express 1.x - 2.5 Gb/s). Это означает, что теперь для линии x16 максимальная скорость передачи данных может достигать 8 GB/s в обоих направлениях против 4 GB/s для старого PCI Express 1.х.

Примечательным фактом является то, что PCI Express 2.0 полностью совместим с PCI Express 1.1. На деле это означает, что старые видеокарты буду спокойно работать в системных платах с новыми разъемами, и новые видеоадаптеры будут без проблем работать в старых разъемах стандарта PCI Express 1.х.

Пожалуй, на этом с теорией и основными особенностями PCI Express давайте закруглимся, пора приступать к соответствующим тестам, чем мы, собственно говоря, и займемся, правда, чуть ниже, а пока давайте детально познакомимся с участниками тестирования.

Об участниках тестирования

К сожалению, охватить больший набор графических ускорителей на момент тестирования не представлялось возможным, что в последующем мы обязательно исправим. Видеокарты класса Low-End исключены из тестов преднамеренно, так как они малопригодны для режимов с высоким разрешением (свыше 1280х1024) при максимальной детализации картинки, где как раз и могут быть выявлены преимущества PCI-E 2.0 над младшим PCI-E 1.1.

Видеокарта

Poin Of View GeForce GTX 280

POV GeForce 9600 GT 512 MB Extreme Overclock

Palit HD 4850 Sonic

Кодовое название чипа

Техпроцесс