Как понять 2 ядерный процессор. В чем преимущество двухъядерных процессоров

Двухъядерный компьютер – это компьютер, центральный процессор которого имеет два ядра. Такая технология позволяет повысить производительность его работы в достаточно большой степени.

Что собой представляет двухъядерный процессор

Двухъядерный процессор - это процессор, на одном кристалле которого находится два ядра. Каждое из ядер имеет, как правило, архитектуру Net Burst. Некоторые из двухъядерных процессоров поддерживают также технологию Hyper-Threading. Данная технология позволяет осуществлять обработку процессов в четырех независимых потоках. Это означает, что один такой двухъядерный процессор с данной технологией (физический) заменяет или эквивалентен четырем логическим процессорам, с точки зрения операционной системы.

Итак, каждое ядро двухъядерного процессора имеет свой собственный кэш второго уровня определенного объема памяти, а также общий кэш с в два раза большей памятью. Как правило, кристаллы, на которых изготавливаются двухъядерные процессоры, имеют размер порядка двухсот квадратных миллиметров с количеством транзисторов, превышающим двести миллионов единиц. Стоит заметить, что при таком огромном количестве элементов данный процессор, казалось бы, должен выделять большое количество тепла и, следовательно, соответствующим образом охлаждаться. Однако это не так.

Наибольшая температура поверхности кристалла составляет около 70оС. Это обусловлено тем, что напряжение, питающее процессор, не превосходит полутора Вольт, а наибольшее значение силы тока составляет сто двадцать пять Ампер. Таким образом, увеличение количества ядер не приводит к существенному увеличению энергопотребления, что очень важно.

Преимущества компьютеров с двухъядерными процессорами

Необходимость в увеличении количества ядер процессора возникла, когда стало понятно, что дальнейшее увеличение его тактовой частоты не приводит к значительным улучшениям в производительности. Компьютеры с двухъядерными процессорами направлены на использование приложений, использующих многопоточную обработку информации. Поэтому польза от такого компьютера возможна не для всех программ. К числу программ, использующих возможности двух ядер, можно отнести такие, как, например, программы рендеринга трёхмерных сцен, программы обработки видеоизображений или аудиоданных. Также двухъядерный процессор принесет пользу при одновременной работе сразу нескольких программ на ПК. В связи с этим, такие процессоры обычно используют в компьютерах, предназначенных для работы с графикой, а также для работы с офисными программами. Таким образом, для игровых нужд данная технология второго ядра почти бесполезна.

В наши дни минимально допустимой нормой комплектации более менее серьёзной вычислительной техники считается наличие двухъядерного процессора. Причём, данный параметр актуален даже для мобильных компьютерных устройств, планшетных ПК и солидных смартфонов-коммуникаторов . Поэтому будем разбираться, что же это за ядра такие и почему о них важно знать любому пользователю.

Суть простыми словами

Первый двухъядерный чип, предназначенный именно для массового потребления, появился в мае 2005-го. Изделие называлось Pentium D (формально относилось к серии Pentium 4). До этого подобные структурные решения применялись на серверах и для специфических целей, в персональные компьютеры не вставлялись.

Вообще, сам по себе процессор (микропроцессор, CPU, Central Processing Unit, центральное процессорное устройство, ЦПУ) - это кристалл, на который с помощью нанотехнологий наносятся миллиарды микроскопических транзисторов, резисторов и проводников. Потом напыляются золотые контакты, «камушек» монтируется в корпусе микросхемы, а затем всё это интегрируется в чипсет .

Теперь представьте себе, что внутри микросхемы установили два таких кристалла. На одной подложке, взаимосвязанные и действующие как единое устройство. Это и есть двухъядерный предмет обсуждения.

Конечно, два «камушка» - не предел. В момент написания статьи мощным считается ПК, оборудованный чипом с четырьмя ядрами, не считая вычислительных ресурсов видеокарты. Ну а на серверах стараниями фирмы AMD уже используется аж шестнадцать.

Нюансы терминологии

У каждого из кристаллов обычно имеется своя собственная кэш-память первого уровня. Однако если оная второго уровня у них общая, то это всё равно один микропроцессор, а не два (или больше) самостоятельных.

Полноценным отдельным процессором ядро можно назвать только в том случае, если таковое обладает собственным кэшем обоих уровней. Но это нужно лишь для применения на очень мощных серверах и всяческих суперкомпьютерах (любимых игрушках учёных).

Впрочем, «Менеджер задач» в ОС Windows или «Системный монитор» в GNU/Linux может показывать ядра как CPU. В смысле, CPU 1 (ЦП 1), CPU 2 (ЦП 2) и так далее. Пусть это не вводит вас в заблуждение, ведь обязанность программы - не разбираться в инженерно-архитектурных нюансах, а всего лишь интерактивно отображать загрузку каждого из кристаллов.

Значит, плавно переходим к этой самой загрузке и вообще к вопросам целесообразности явления как такового.

Зачем это нужно

Количество ядер, отличающееся от единицы, задумано в первую очередь для распараллеливания выполняемых задач.

Предположим, вы включили ноутбук и читаете сайты во всемирной паутине . Скрипты, коими современные веб-страницы перегружены просто до неприличия (кроме мобильных версий), будут обрабатываться только одним ядром. На него и обрушится стопроцентная нагрузка, если что-то нехорошее сведёт браузер с ума.

Второй кристалл продолжит работать в нормальном режиме и позволит справиться с ситуацией - как минимум, открыть «Системный монитор» (или эмулятор терминала) и принудительно завершить спятившую программу.

Кстати, именно в «Системном мониторе» вы сможете собственными глазами увидеть, какой именно софт внезапно слетел с катушек и который из «камушков» заставляет кулер отчаянно завывать.

Некоторые программы изначально оптимизированы под многоядерную архитектуру процессоров и сразу же отправляют разные потоки данных в разные кристаллы. Ну а обычные приложения обрабатываются по принципу «один поток - одно ядро».

То бишь, прирост производительности станет ощутимым, если одновременно действует более одного потока. Ну а поскольку почти все ОС являются многозадачными, позитивный эффект от распараллеливания будет проявляться практически постоянно.

Как с этим жить

Касаемо вычислительной техники массового потребления, чипы с одним ядром нынче - это, в основном, ARM-процессоры в простеньких телефонах и миниатюрных медиаплеерах. Выдающейся производительности от таких приборов не требуется. Максимум - браузер Opera Mini запустить, клиент ICQ, несложную игру, прочие непритязательные приложения на Java.

Всё остальное, начиная даже с самых дешёвых планшетов, должно иметь в чипе минимум два кристалла, как сказано в преамбуле. Такие вещи и приобретайте. Исходя хотя бы из тех соображений, что практически весь пользовательский софт стремительно толстеет, потребляет всё больше системных ресурсов, поэтому запас мощности ничуть не помешает.

Предыдущие публикации:

Фактически в каждой отрасли существует разделение продуктов по целевым категориям. Есть масса дешевых продуктов, обладающих базовыми функциями и возможностями; они предназначены для подавляющего большинства пользователей. На небольшую группу экспертов и профессиональных пользователей ориентированы дорогие устройства, с массой тонких настроек и специфическими функциями. А промежуток между этими двумя группами пользователей не так мал, как может показаться на первый взгляд.

В него попадают те люди, которым уже недостаточно возможностей начального уровня; эти пользователи, так сказать, "выросли", и бюджетные продукты их уже не удовлетворяют. С другой стороны, топовая продукция для них достаточно дорога, и в плане опыта они до нее еще "не доросли". И именно для этой группы людей компании выпускают различные продукты среднего уровня, с промежуточным набором функций. И совершенно не имеет значения, о каких именно продуктах идет речь, будь то мобильные телефоны или фотоаппараты (что сейчас уже почти одно и то же), музыкальные центры или автомобили.

Заканчивая эту мысль, хотим подчеркнуть, что многие начинающие пользователи зачастую покупают продукты среднего уровня "на вырост". Иными словами, на начальном этапе они пользуются только базовыми возможностями, но с ростом опыта постепенно задействуют все больший и больший круг функций. Маркетологи на редкость удачно эксплуатируют эту идею, и в некоторых отраслях промышленности продукция средней ценовой категории имеет наибольшее процентное соотношение.

Теперь переходим непосредственно к предмету нашего обзора, а именно - к четырехъядерному процессору Intel Q8300 на ядре Yorkfield. Изначально, все процессоры с четырьмя ядрами предназначались исключительно для рабочих станций, за которыми работают профессиональные пользователи. Последние используют соответствующие их уровню программные пакеты, которые имеют оптимизацию многопоточных вычислений. Для таких пользователей наши рекомендации оставались всегда неизменными: для достижения наивысшей производительности необходимо приобретать самую последнюю платформу (исключение было с NetBurst) и использовать самый быстрый процессор, а также максимально возможный (соответствующий возможностям ОС) объем оперативной памяти.

Однако кроме профессионалов, есть еще масса других пользователей, которые иногда работают с многопоточными программами. Кто-то вечерами изучает новый пакет, кто-то делает "шабашку", а кто-то дома разрабатывает заготовки, чтобы на следующий день закончить их на работе. Именно такие пользователи нуждаются в недорогом процессоре с максимальным количеством ядер.

Еще одна группа пользователей совершенно далека от многопоточности и вообще от компьютеров. Они покупают четырехъядерные процессоры, потому что они "в два раза лучше, чем двухъядерные".

Ситуация, в общем-то, не нова - в свое время так "покупали мегагерцы". Понятно, что реальной пользы от четырех ядер эти покупатели не получают, поскольку подавляющее большинство домашних приложений не оптимизировано под многопоточность. Судите сами: после запуска игры вы вынуждены просмотреть от одного до четырех роликов с логотипами компаний-разработчиков и обладателей лицензий. Еще один ролик может быть вступительным. А после завершения всех роликов игра только начинает загружаться , и делает это достаточно долго. Почему игра не может загружаться параллельно, во время прокрутки роликов? В принципе, ответ понятен: программы без оптимизации разрабатывать куда проще и главное - финансово выгоднее!

Ну да ладно, все это мы уже не раз говорили в том или ином виде. Сейчас обратимся к компании Intel, которая после перехода на 45-нм техпроцесс довольно оперативно насытила рынок четырехъядерными процессорами высшего уровня. После этого Intel стала постепенно выводить на рынок более дешевые четырехъядерники, с несколько урезанным кэшем и относительно невысокими тактовыми частотами.

Первым таким продуктом стал процессор Q8200 на ядре Yorkfield, с тактовой частотой 2,33 ГГц и 1333 МГц шиной QPB. Напомним, что большинство топовых 4-ядерных процессоров серии Q9xxx имеет кэш L2=12 Мб (2х 6 Мб), и только модель Q9300 оснащена L2=6 Мб (2х 3 Мб). И чтобы более дешевые процессоры не обгоняли по скорости более дорогие, Intel продолжила практику "урезания" кэша второго уровня, и для серии Q8xxx его объем установили на уровне 4 Мб (2х 2Мб). Соответственно, "табель о рангах" 4-ядерных процессоров Intel выглядит следующим образом:

Наименование

Количество ядер

Частота, ГГц

Множитель

Core 2 Extreme QX9770
Core 2 Extreme QX9650
Core 2 Quad Q9550
Core 2 Quad Q9450
Core 2 Quad Q9300
Core 2 Quad Q8300
Core 2 Quad Q8200

Кроме этих спецификаций, у процессоров есть еще один параметр, который постоянно изменяется (до кризиса мы написали бы - понижается). Это розничная цена. Для профессионалов она роли не играет, а вот для полупрофессиональных пользователей еще как играет. Так вот для последних есть хорошие новости: тестовый процессор Q8300 стоит около $230, а его OEM-вариант - около $200! И, грубо говоря, мы получаем четыре процессора с частотой 2,5 ГГц по $50 каждый. С точки зрения профессионалов - это халява.

Итак, халява выглядит следующим образом:

Обратная сторона:


Утилита CPU-Z предоставляет следующую информацию:

В функциональном отношении этот процессор ничем не уступает своим, более старшим, собратьям. То есть процессор поддерживает все расширенные наборы команд, а также все современные технологии Intel в плане энергосбережения. Единственное, что отличает процессоры "восьмой" серии от "девятой", - это отсутствие технологии виртуализации.

Разгон

Несколько слов о разгоне. С одной стороны, процессор Q8300 должен быть весьма привлекательным с точки зрения оверклокинга. В пользу этого предположения говорит тот факт, что частотный потенциал ядра Yorkfield находится в районе 4 ГГц. Причем эту частоту мы достигли еще больше года назад, когда тестировали процессор Core 2 Extreme QX9650 . С тех пор компания Intel наверняка оптимизировала и усовершенствовала технологический процесс, и частотный потенциал возрос.

Однако стоит учитывать и некоторые отрицательные моменты. Во-первых, разгон QX9650 мы осуществляли увеличением множителя, который у данной модели разблокирован. Напротив, у Q8300 множитель заблокирован, а относительно высокая частота системной шины подразумевает довольно низкий штатный множитель. Он, собственно, таким и является, и равен 7,5; к тому же, он еще и заблокирован.

В результате, для разгона до частоты 4 ГГц частота FSB должна быть в районе 533 МГц. Для большинства современных материнских плат данная частота не является чем-то заоблачным: мы постоянно достигаем частот 550 МГц и выше. Однако стоит учитывать, что данные тесты осуществляются с двухъядерным процессором, тогда как процессор с четырьмя ядрами в значительной степени увеличивает нагрузку на системную шину. В результате, оверклокер вынужден значительно увеличивать напряжение на FSB, повышать напряжение PLL и подбирать GTL. И все равно, большинство энтузиастов сталкивается со значительными проблемами в районе частоты 500 МГц. С этими проблемами столкнулись и мы: итоговый результат - стабильная частота FSB равна 480 МГц, что дало результирующую частоту процессора 3,6 ГГц.

С одной стороны, результат можно считать довольно неплохим, поскольку для производства дорогих высокочастотных процессоров Intel использует самые "лучшие ядра", а для дешевых - то, что осталось. С другой стороны, у нас осталось стойкое впечатление, что если бы множитель был разблокирован, мы бы спокойно запустили Q8300 на частоте 4 ГГц.

Производительность

В тестовой системе было использовано следующее оборудование:

Тестовое оборудование
Материнская плата ASUS P5E3 Premium на чипсете Intel X48
Кулер Gigabyte G-Power
Видеокарта ASUS 8800 GT (GeForce 8800 GT; PCI Express x16)

Версия драйвера: 180.48 WHQL

Звуковая карта -
HDD Samsung HD160JJ
Память 2x1024 Мб Qimonda DDR3-1333;
Корпус FSP 550 Вт
OS MS Vista

Вначале посмотрим на результаты синтетических тестов.





Тесты прикладного ПО.



Кодирование видео (DivX, Xvid) измерялось в секундах, т.е. меньше - это лучше.



Сжатие данных (WinRAR) измерялось в кб/с., т.е. больше - это лучше.


Теперь - тесты игровых программ.








Выводы

С точки зрения производительности, процессор Q8300 занимает именно то место, которое ему отвели маркетологи Intel. То есть он быстрее и дороже процессора Q8200, но медленнее и дешевле остальных четырехъядерных процессоров Intel. И несколько месяцев назад вывод звучал бы так: при выборе 4-ядерного процессора нужно обратить внимание на продукцию Intel и руководствоваться своими финансовыми возможностями.

Однако с выходом новых процессоров AMD Phenom II, ситуация несколько осложнилась, поскольку выбор стал больше, и решить проблему выбора процессора стало труднее. Дело в том, что удельная производительность процессоров AM3 практически такая же, как и у процессоров Intel. И при этом процессоры AMD стоят дешевле. В частности, модель Phenom II X4 805 продается в по цене около $210 (март 2009). Соответственно, наш совет тем пользователям, которые начинают работать с профессиональными программными пакетами, заключается в следующем.

На первом этапе необходимо оценить степень оптимизации используемого ПО под многопоточные вычисление. Если такая оптимизация присутствует, то тогда есть смысл переходить на 4-ядерные процессоры. Затем нужно определить, под какие процессоры оптимизировано используемое ПО, и на основе этого приобрести процессор нужного производителя. И только после этого имеет смысл выбирать конкретную модель процессора, исходя из стоимости.

Тем пользователям, которые планируют разогнать свой процессор, мы хотим еще раз напомнить, что процессоры серии Q8xxx имеют относительно низкие заблокированные множители, и в большинстве случаев вы не сможете достигнуть технологического предела ядра Yorkfield.

Кстати, если разгон в профессиональных рабочих станциях вызывает однозначное осуждение (ибо там важна 100% стабильность), то для домашней системы он только приветствуется. Дело в том, что без существенных финансовых затрат вы можете значительно повысить производительность. При этом потеря данных или результатов вычислений не нанесет существенного вреда, поскольку ваша полупрофессиональная работа является своего рода хобби.

Сергей Озеров,

Недавно два микропроцессорных гиганта – Intel и AMD – дружно выпустили свои первые двухъядерные процессоры, которые уже успели наделать много шума. Новые микропроцессоры получились не просто интересными, но представляют собой весьма многогранные продукты, тщательное исследование которых не может ограничиться одним-двумя обзорами, написанными по горячим следам. Мы постараемся рассказать об этих новых продуктах более подробно и, по возможности, с разных сторон...

Итак, недавно два микропроцессорных гиганта – Intel и AMD – дружно выпустили свои первые двухъядерные процессоры, которые уже успели наделать много шума. Эти продукты стали не просто очередными конкурирующими новинками от лидеров отрасли персональных компьютеров (как это часто бывало в последние годы), но возвестили своим появлением о начале (не побоимся громких слов) целой эры (в тактическом и даже стратегическом понимании) «настольных» вычислений, очередного витка проникновения профессиональных технологий в потребительский сегмент. Новые микропроцессоры получились не просто интересными, но представляют собой весьма многогранные продукты, тщательное исследование которых не может ограничиться одним-двумя обзорами, написанными по горячим следам (каковыми можно признать большинство статей с тестами, спешно выполненными за несколько дней после получения сэмплов). Мы постараемся рассказать об этих новых продуктах более подробно и, по возможности, с разных сторон, не ограничивая себя жесткими временными рамками. Впрочем, мы также приглашаем к обсуждению этих продуктов и наших читателей – нa нашем Форуме и в виде авторских заметок, которые, при удачном сочетании таланта и смекалки их написавших, могут быть опубликованы на нашем ресурсе. :)

Но начнем мы, как и подобает, с теории. Благо, здесь явно есть, что обсудить.

Классификация: SMP, NUMA, кластеры…

Очевидно, что «ноги» у новых процессоров растут из многопроцессорных систем. А вариантов создания многопроцессорных систем – неисчислимое множество: даже простое перечисление всего созданного за прошедшие годы заняло бы слишком много места. Однако существует их общепринятая классификация:

(Symmetrical Multi Processor systems). В подобной системе все процессоры имеют совершенно равноправный доступ к общей оперативной памяти (см. рисунок). Работать с такими системами программистам – сущее удовольствие (если, конечно, создание многопоточного кода можно назвать «удовольствием»), поскольку не возникает никаких специфичных «особенностей», связанных с архитектурой компьютера. Но, к сожалению, создавать подобные системы крайне трудно: 2-4 процессора – практический предел для стоящих разумные деньги SMP-систем. Конечно, за пару сотен тысяч долларов можно купить системы и с большим числом процессоров… но при цене в несколько миллионов (!) долларов за SMP с 32-мя CPU становится экономически более целесообразно использовать менее дорогостоящие архитектуры.

(Non-Uniform Memory Access systems). Память становится «неоднородной»: один её кусок «быстрее», другой – «медленнее», а отклика от во-о-он того «дальнего» участка вообще можно ждать «пару лет». В системе при этом образуются своеобразные «островки» со своей, быстрой «локальной» оперативной памятью, соединенные относительно медленными линиями связи. Обращения к «своей» памяти происходят быстро, к «чужой» - медленнее, причем чем «дальше» чужая память расположена, тем медленнее получается доступ к ней (см. рис.). Создавать NUMA-системы куда проще, чем SMP, а вот программы писать сложнее – без учета неоднородности памяти эффективную программу для NUMA уже не напишешь.


3. Наконец, последний тип многопроцессорных систем – кластеры . Просто берем некоторое количество «почти самостоятельных» компьютеров (узлы кластера или «ноды») и объединяем их быстродействующими линиями связи. «Общей памяти» здесь может и не быть вообще, но, в принципе, и здесь её несложно реализовать, создав «очень неоднородную» NUMA-систему. Но на практике обычно удобнее работать с кластером в «явном» виде, явно описывая в программе все пересылки данных между его узлами. То есть если для NUMA еще можно создавать программы, почти не задумываясь над тем «как эта штука работает» и откуда берутся необходимые для работы потоков данные; то при работе с кластером требуется очень четко расписывать кто, что и где делает. Это очень неудобно для программистов, и, вдобавок, накладывает существенные ограничения на применимость кластерных систем. Но зато кластер – это очень дешево.

Intel сегодня предпочитает создавать SMP-системы; AMD, IBM и Sun - те или иные варианты NUMA. Основная «область применения» кластеров – суперкомпьютеры.

Многоядерные процессоры

Основные вехи в истории создания двухъядерных процессоров таковы:

1999 год – анонс первого двухъядерного процессора в мире (IBM Power4 для серверов)
2001 год – начало продаж двухъядерного IBM Power4
2002 год – почти одновременно AMD и Intel объявляют о перспективах создания своих двухъядерных процессоров
2002 год – выход процессоров Intel Xeon и Intel Pentium 4 с технологией Hyper-Threading, обеспечивающей виртуальную двухпроцессорность на одном кристалле
2004 год – свой двухъядерный процессор выпустила Sun (UltraSPARC IV)
2004 год – IBM выпустила второе поколение своих двухъядерных процессоров (IBM Power5). Каждое процессорное ядро Power5 поддерживает аналог технологии Hyper-Threading
2005 год, 18 марта – Intel выпустила первый в мире двухъядерный процессор архитектуры x86
2005 год, 21 марта – AMD анонсировала полную линейку серверных двухъядерных процессоров Opteron, анонсировала десктопные двухъядерные процессоры Athlon 64 X2 и начала поставки двухъядерных Opteron 8xx
2005 год, 20-25 мая – AMD начинает поставки двухядерных Opteron 2xx
2005 год, 26 мая – Intel выпускает двухъядерные Pentium D для массовых ПК
2005 год, 31 мая – AMD начинает поставки Athlon 64 X2

Идея многоядерного процессора выглядит на первый взгляд совершенно тривиальной: просто упаковываем два-три (ну или сколько там влезет) процессора в один корпус - и компьютер получает возможность исполнять несколько программных потоков одновременно. Вроде бы бесхитростная стратегия… но конкретные её реализации в недавно вышедших настольных процессорах AMD и Intel заметно различаются. Различаются настолько, что сугубо «количественные» мелочи в конечном итоге переходят в качественные различия между процессорами этих двух компаний. Поэтому перед тем как переходить собственно к тестам современных двухъядерников, попробуем разобраться в различиях подходов этих микропроцессорных гигантов и, так сказать, «авансом» высказать некоторые предположения об их производительности.

Intel Smithfield: «классика жанра»

При создании многоядерных процессоров для настольных ПК микропроцессорный гигант предпочел пойти на первых порах по пути «наименьшего сопротивления», продолжив традиции создания привычных для себя SMP-систем с общей шиной. Выглядит подобная MP-система чрезвычайно просто: один чипсет, к которому подключается вся оперативная память, и одна процессорная шина, к которой подключены все процессоры:

В случае новеньких двухъядерных процессоров Smithfield два обычных ядра, аналогичных Prescott, просто расположены рядом на одном кристалле кремния и электрически подключены к одной (общей) системной шине. Никакой общей схемотехники у этих ядер нет.

Сегодняшнее ядро Smithfield является «монолитным» (два ядра образуют единый кристалл процессора), однако следующее поколение настольных процессоров Intel (Presler, изготавливаемый по 65-нм технологии) будет еще тривиальнее – два одинаковых кристалла одноядерных процессоров (Cedar Mill) просто будут упакованы в одном корпусе (см. рис.).

Точно таким же будет и первый серверный процессор Intel данной микроархитектуры, известный сейчас под именем Dempsey. Но если у Smithfield на каждое из ядер приходится по 1 Мбайт кэш-памяти второго уровня, то у Presler и Dempsey это будет уже по 2 Мбайт на ядро.

Между тем, позднее у Intel пойдут другие, более сложные в плане микроархитектуры варианты двухъядерных процессоров, среди которых стоит отметить Montecito (двухъядерный Itanium), Yonah (двухъядерный аналог Pentium M) и Paxville для многопроцессорных серверов на базе Intel Xeon MP. Еще в марте этого года Патрик Гелсингер объявил, что в разработке у Intel находятся аж 15 различных многоядерных CPU, и пять из них корпорация даже демонстрировала в работе.

Причем, если еще в середине 2004 года официальные лица Intel отмечали, что многоядерные процессоры – это не «очередная гонка за производительностью», поскольку программная инфраструктура была тогда еще не очень готова поддержать такие процессоры оптимизированными приложениями, то теперь многоядерность у Intel поставлена во главу угла во всех базовых направлениях деятельности, в том числе – в разработке и отладке приложений (ну разве что кроме коммуникаций и сенсорных сетей – пока;)). И в этом нет ничего удивительного – тактовую частоту процессоров стало наращивать все труднее и труднее, и, стало быть, надо искать что-то на cмену «гонки за мегагерцами». А добавляя ядра, производительность в ряде современных приложений уже можно заметно поднять, не повышая частоты. Да и пресловутый закон Мура (удвоение числа транзисторов на кристаллах) надо бы чем-то поддержать, а многоядерность – чуть ли не самый простой путь для этого… :)

Собственно, мультиядерность в текущем понимании Intel – это один из трех возможных вариантов:

1. Независимые процессорные ядра, каждое со своей кэш-памятью, расположены на одном кристалле и просто используют общую системную шину. Это - 90-нанометровый Pentium D на ядре Smithfield.

2. Похожий вариант – когда несколько одинаковых ядер расположены на разных кристаллах, но объединены вместе с одном корпусе процессора (многочиповый процессор). Таким будет 65-нанометровое поколение процессоров семейств Pentium и Xeon на ядрах Presler и Dempsey.

3. Наконец, ядра могут быть тесно переплетены между собой на одном кристалле и использовать некоторые общие ресурсы кристалла (скажем, шину и кэш-память). Таким является ближайший Itanium на ядре Montecito. А также мобильный Yonah, выход которого обещает наделать очень много шума.

Попутно отметим, что Montecito, изготавливаемый по 90-нм техпроцессу, будет иметь по сравнению с предшественником на 130-нм ядре Madison и ряд других преимуществ: наличие Hyper-Threading (то есть он будет виден в системе как 4 логических процессора), заметно меньшее энергопотребление, более высокую производительность (в 1,5 раза и выше), вчетверо больший размер кэш-памяти (свыше 24 Мбайт: 2x1 Мбайт L2 инструкций, 2x12 Мбайт L3 данных), 1,72 миллиарда транзисторов против 410 миллионов и другое. Выйдет этот процессор в четвертом квартале 2005 года.


Не менее интересным ожидается и первый двухъядерный мобильный процессор Yonah, который должен появиться в начале 2006 года в рамках новой мобильной платформы Napa. Yonah будет иметь два вычислительных ядра, использующих общую 2-мегабайтную кэш-память второго уровня и общий же контроллер системной шины QPB с частотой 667 МГц. Он будет выпускаться по 65-нм технологии в форм-факторах PGA 478 и BGA 479, содержать 151,6 млн. транзисторов, поддерживать технологию XD-bit и, судя по предварительной информации, поддерживать некоторые механизмы прямого взаимодействия ядер между собой.

Более того, Intel не исключают и того, что процессоры на «мобильном» ядре Yonah будут использоваться не только в определенных сегментах рынка настольных компьютеров (для этого уже разработаны и демонстрируются соответствующие мини-концепты домашнего и офисного ПК), но даже в компактных экономичных серверах.

Многоя́дерный проце́ссор - центральный процессор, содержащий два и более вычислительных ядра на одном процессорном кристалле или в одном корпусе.

Среди многоядерных процессоров к данному моменту можно выделить

*процессоры, предназначенные в основном для встраиваемых и мобильных приложений, в которых большое внимание разработчиков было уделено средствам и методам снижения энергопотребления (SEAforth (SEAforth24, seaforth40), Tile (Tile36, Tile64, Tile64pro), AsAP-II, CSX700);

*процессоры для вычислительных или графических станций, где вопросы энергопотребления не столь критичны (графические процессоры, например, процессоры серии g80 от NVIDIA, проект Larrabee от Intel, отчасти сюда можно отнести и процессор Cell от IBM, хотя количество вычислительных ядер у него относительно невысоко);

* процессоры т.н. мейнстрима - предназначенные для серверных, рабочих станций и персональных компьютеров (AMD, Intel, Sun);

  • Количество ядер (Количество ядер. Ядро (core) – кристалл кремния площадью примерно один квадратный сантиметр, на котором посредством микроскопических логических элементов реализована принципиальная схема процессора, так называемая архитектура. Каждое ядро воспринимается системой как отдельный, самостоятельный процессоров, со всем необходимым набором функций.)

Тактовая частота (такт - элементарная операция в секунду, которую может выполнить процессор. Следовательно, количество тактов - это показатель, сколько операций в секунду времени способен обработать процессор. Единицей измерения этого параметра являются гигагерцы ГГц.)

Кеш-память (память, непосредственно встроенная в процессор, и используемая для хранения и обращения к часто используемым данным, называется кеш-память. Она делиться на несколько уровней - L1, L2 и L3. Вышестоящий уровень кеш-памяти имеет больший объем, но менее скоростной доступ к данным.)

Разрядность (определяет количество информации, которой может обменяться процессор с оперативной памятью за один такт. Параметр этот измеряется в битах. Параметр разрядности влияет на объем возможной оперативной памяти - 32-х битный процессор может работать только с 4 Гб оперативной памяти.)

Производительность

Потребляемая мощность

Размеры

Стоимость

Классы задач, на которые рассчитаны

Сравнительные характеристики производительности процессоров, потребляемой мощности и скоростей обмена данными представлены в таблицах

(Мфлопс - миллион операций с плавающей точкой в секунду)

Немалый вклад в общую производительность процессора и эффективность его работы вкладывает и структура межъядерных связей и организация подсистемы памяти, в частности кэш-памяти


Процессор CSX700

Архитектура процессора CSX700 была разработана для решения так называемой проблемы массо-габаритных показателей и потребляемой мощности (Size, Weight and Power (SWAP)), которая, как правило, является основной для встраиваемых высокопроизводительных приложений. Путем интегрирования процессоров, системных интерфейсов и встроенной памяти с коррекцией ошибок, CSX700 представляет собой достаточно экономичное, надежное и производительное решение, отвечающее требованиям современных приложений.

Архитектура процессора оптимизирована для работы с применением массового параллелизма данных и спроектирована с высокой степенью эффективности и надежности. Архитектура нацелена на интеллектуальную обработку сигналов и обработку изображений во временной и частотной областях.

Кристалл CSX700 содержит 192 высокопроизводительных процессорных ядра, встроенную буферную память размером 256 кбайт (два банка по 128 кбайт), кэш данных и кэш команд, ECC-защиту внутренней и внешней памяти, встроенный контроллер прямого доступа в память. Для обеспечения накристаль-ной и межкристальной сети используется технология ClearConnect NoC (рис. 11).

Процессор состоит из двух относительно независимых модулей MTAP (MultiThreaded Array Processor - многопотоковый процессорный массив), содержащих кэши инструкций, данных, блоки управления процессорными элементами, и набор из 96 вычислительных ядер (рис. 12).

Рис. 12. Структура MTAP-блока

Каждое ядро имеет двойной блок вычислений с плавающей точкой (сложение, умножение, деление, вычисление квадратного корня, поддерживаются числа одинарной и двойной точности), 6 кбайт высокопроизводительной оперативной памяти, 128-байтный регистровый файл. Поддерживается 64-битное виртуальное адресное пространство и 48-битное реальное.

Технические характеристики процессора:

тактовая частота ядер 250 MГц;

96 ГФлоп для данных двойной или одинарной точности;

поддерживает 75 ГФлоп при тесте перемножения матриц двойной точности (DGEMM);

производительность целочисленных операций 48 ШАОс;

рассеиваемая мощность 9 Вт;

пропускная способность внутренних шин памяти 192 Гбайт/с;

две внешние шины памяти 4 Гбайт/с;

скорость обмена данными между отдельными процессорами 4 Гбайт/с;

интерфейсы PCIe, 2·DDR2 DRAM (64 бита).

Разработанный для систем с низким энергопотреблением, данный процессор работает на относительно низкой тактовой частоте и имеет механизм управления частотой, который позволяет регулировать производительность приложений в условиях определенного энергопотребления и теплового окружения.

CSX700 поддерживается профессиональной средой разработки (SDK) на основе технологии Eclipse с визуальными средствами отладки приложений, базирующейся на оптимизированном компиляторе ANSI C с расширениями для параллельного программирования. В дополнение к стандартной библиотеке С идет набор оптимизированных библиотек с такими функциями, как БПФ, BLAS, LAPACK и др.

Современные процессоры Intel и AMD

Современный рынок процессоров делят два главных конкурента – Intel и AMD.

Процессоры от компании Intel, сегодня считаются самыми производительными, благодаря семейству Core i7 Extreme Edition. В зависимости от модели они могут иметь до 6 ядер одновременно, тактовую частоту до 3300 МГц и до 15 Мб кэш памяти L3. Самые популярные ядра в сегменте настольных процессоров создаются на основе Intel - Ivy Bridge и Sandy Bridge.

В процессорах компании Intel применяются фирменные технологии собственной разработки для повышения эффективности работы системы.

1. Hyper Threading - За счет этой технологии, каждое физическое ядро процессора способно обрабатывать по два потока вычислений одновременно, получается, что число логических ядер фактически удваивается.

2. Turbo Boost - Позволяет пользователю совершить автоматический разгон процессора, не превышая при этом максимально допустимый предел рабочей температуры ядер.

3. Intel QuickPath Interconnect (QPI) - Кольцевая шина QPI соединяет все компоненты процессора, за счет этого сводятся к минимуму все возможные задержки при обмене информацией.

4. Visualization Technology - Аппаратная поддержка решений виртуализации.

5. Intel Execute Disable Bit - Практически антивирусная программа, она обеспечивает аппаратную защиту от возможных вирусных атак, в основе которых лежит технология переполнения буфера.

6. Intel SpeedStep-Инструмент позволяющий изменять уровень напряжения и частоты в зависимости от создаваемой нагрузки на процессор.

Core i7 – на данный момент топовая линия компании

Core i5 – отличаются высокой производительностью

Core i3 – невысокая цена, высокая/средняя производительность

Самые быстрые процессоры фирмы AMD все же медленнее, чем самые быстрые процессоры Intel (данные на ноябрь 2010). Но благодаря своему хорошему соотношению цены и качества, процессоры AMD, в основном для настольных ПК, являются прекрасной альтернативой процессорам Intel.

Для процессоров Athlon II и Phenom II важным является не только тактовая частота, но и количество ядер процессора. Athlon II и Phenom II в зависимости от модели могут иметь два три или четыре ядра. Модель с шестью ядрами – только серия Highend Phenom II.

Большинство современных процессоров созданных компанией AMD по умолчанию поддерживают следующие технологии:

1. AMD Turbo CORE - Эта технология призвана автоматически регулировать производительность всех ядер процессора, за счет управляемого разгона (подобная технология у компании Intel имеет название TurboBoost).

2. AVX (Advanced Vector Extensions), ХОР и FMA4 - Инструмент, имеющий расширенный набор команд, специально созданных для работы с числами с плавающей точкой. Однозначно полезный инструментарий.

3. AES (Advanced Encryption Standard) - В программных приложениях использующих шифрование данных, повышает производительность.

4. AMD Visualization (AMD-V) - Эта технология виртуализации, помогает обеспечить разделение ресурсов одного компьютера между несколькими виртуальными машинами.

5. AMD PowcrNow! - Технология управления питанием. Она помогают пользователю добиться повышения производительности, за счет динамической активации и деактивации части процессора.

6. NX Bit - Уникальная антивирусная технология, помогающая предотвратить инфицирование персонального компьютера определенными видами вредоносных программ.

Использование в ГИС

Геоинформационные системы - многофункциональные средства анализа сведенных воедино табличных, текстовых и картографических данных, демографической, статистической, земельной, муниципальной, адресной и другой информации. Многоядерные процессоры необходимы для быстрой обработки различных видов информации, так как они значительно ускоряют и распределяют работу программ.

ВЫВОД

Переход к многоядерным процессорам становится основным направлением повышения производительности. На данный момент самым распространенным считается 4-х и 6-и ядерные процессоры. Каждое ядро воспринимается системой как отдельный, самостоятельный процессоров, со всем необходимым набором функций. Технология многоядерных процессоров, позволила распараллелить операции вычисления, вследствие чего повысился показатель быстродействия ПК.

http://www.intuit.ru/department/hardware/mcoreproc/15/

http://kit-e.ru/articles/build_in_systems/2010_2_92.php

http://softrew.ru/instructions/266-sovremennye-processory.html

http://it-notes.info/centralnyj-processor/

http://www.mediamarkt.ru/mp/article/AMD,847020.html

Преимущества многоядерных процессоров

Возможность распределять работу программ, например, основных задач приложений и фоновых задач операционной системы, по нескольким ядрам;

Увеличение скорости работы программ;

Процессы, требующие интенсивных вычислений, протекают намного быстрее;

Более эффективное использование требовательных к вычислительным ресурсам мультимедийных приложений (например, видеоредакторов);

Снижение энергопотребления;

Работа пользователя ПК становится более комфортной;