ИТ-технологии для профессионалов

Показаны сообщения с ярлыком Nehalem. Показать все сообщения
Показаны сообщения с ярлыком Nehalem. Показать все сообщения

понедельник, 24 августа 2009 г.

Память DDR3 и процессоры Intel Xeon 5500 (nehalem)

Основные вопросы, на которые нужно ответить при выборе конфигурации памяти DDR3:

1. Нужно получить максимальный объём или максимальную производительность памяти?

2. Какие процессоры будут использоваться?

3. Какое соотношение цена/производительность для нас оптимальна?

Отличия в использовании DDR2 и DDR3

DDR2 и процессоры Intel Xeon 5400

- До 4 каналов

- До 4 DIMM на канал

- Память Fully-buffered DDR2 533/667/800

- Максимальный объем 128Гб

DDR3 и процессоры Intel Xeon 5500

- До 6 каналов

- До 3 DIMM на канал

- Память DDR3 800/1066/1333

- Максимальный объем 144Гб

image image

Варианты конфигурирования

Для оптимального выбора конфигурации DDR3 необходимо четко понимать, что нам важнее производительность или объем. Ниже представлены конфигурации для этих обоих вариантов и сбалансированный вариант.

Максимальная производительность

Для обеспечения максимальной производительности необходимо использовать память DDR3 с частотой 1333MHz и процессоры серии X5550, т.к. только они способны обеспечить необходимую пропускную способность шины QPI (10,6 GB/s). Такая конфигурация накладывает ограничение на максимальный объем памяти в 48GB, т.к. возможно установить только 1 модуль памяти на 1 канал процессора.

imageМаксимальная производительность

Максимальный объем

В этом случае необходима память с частотой 800MHz и любые процессоры серии X5500. Пропускная способность шины QPI при этом будет 6,4GB/s. При этом можно будет установить до 18 модулей памяти, то есть по 3 модуля на канал, и получить объем в 144GB.

image
Максимальный объем

 

Сбалансированный

Оптимальный вариант, межу производительностью и объемом. Необходимо использовать память DDR3 с частотой 1066 MHz, процессоры серии E5520 или старше. В такой конфигурации возможна установка по 2 модуля памяти на канал (всего 12 модулей) и получить общий объем памяти 96GB.

image
Сбалансированный вариант

Типы памяти

Но это не все. Кроме ранжирования по скорости MHz, есть 3 вида памяти DDR3: Registered DIMMs (RDIMM), Unbuffered ECC DIMMs (UDIMM ECC) и Unbuffered DIMMs (UDIMM). Сразу отмечу что Unbuffered DIMMs (UDIMM) не рекомендуется использовать в серверах. Так же модули памяти бывают разных рангов.

Сравнение UDIMM и RDIMM:

UDIMM

RDIMM

Регистр/Буфер

Нет

Есть

Частоты

800, 1066, 1333 МГц

800, 1066, 1333 МГц

Количество рангов

1 или 2

1, 2 или 4

Максимальное кол-во модулей на канал

2

3

Объем модулей

1 и 2 Гб

1,2,4 и 8 Гб

ECC

Поддерживает

Поддерживает

SDDC

X8

X4 и X8

Четность адреса

Нет

Поддерживает

Энергопотребление

~5W

~5.75W

RDIMMs:: Хотя они на несколько процентов медленнее чем UDIMM, они позволяют получить больший общий объем памяти. Поддерживают до 3 DIMMs/канал.

UDIMM ECC: поддерживает все RAS функции RDIMM кроме x4 Single Device Data Correction (SDDC).

Для систем начального уровня с объемом ОЗУ 12Гб или меньше, целесообразно использовать UDIMM ECC, т.к. у них меньше стоимость. Регистровую память имеет смысл использовать в материнских платах, где по 3 слота на канал (на будущее расширение без выбрасывания старой памяти) или модули по 4ГБ.

imageОтносительная стоимость модулей

Ранги (Single, Dual, Quad)

Не будем детально разбирать вопрос рангов. Остановимся на наиболее важных моментах. Итак, на рисунках наглядно показано основные отличия разноранговой памяти. Технологически, при производстве, дешевле размещать большее чипов на одном модуле, то есть изготавливать память типа quad rank.

image image
Физическое устройство разноранговой памяти

Латентность QR модулей меньше, т.к. в них одновременно может быть открыто несколько страниц. Так же есть ограничение в 8 рангов на канал, т.е в один канал можно поставить только 2 QR модуля (у разных производителей, кол-во поддерживаемых рангов может отличаться в зависимости от модели материнской платы). На данный момент Quad Rank бывают только модули RDIMM.

Еще отмечу момент, что при установки памяти с разным количеством рангов, первыми устанавливаются QR модули, потом DR и SR.

Выбор модулей оптимального объема.

Сейчас рассмотрим, какого объема лучше использовать модули, для получения необходимого объема памяти на ядро. Т.к. это позволит сэкономить деньги, и получить оптимальную производительность.

При использовании RDIMM-ов, возможны следующие конфигурации (при использовании 2х 4х ядерных процессоров Nehalem-EP)

image 
image
image image

В таблице представлены основные конфигурации памяти. Сначала в первой строке выбираем желаемый объем памяти на 1 ядро.
Во второй строчке указа общий объем памяти, который мы получим.
Далее ниже рассмотрены варианты с разным объемом каждого модуля. Красным выделены оптимальные конфигурации.

При использовании UDIMM-ов ECC (при использовании 2х 4х ядерных процессоров Nehalem-EP)

image image
image image

DDR3 UDIMMs ограничены 2 DIMMs на канал, или в общей сложности 12 DIMMs.
Принцип выбора тот же что и при RDIMM.

Баланс памяти по каналам в конфигурации

В таблицах есть не сбалансированные конфигурации. Не сбалансированной конфигурация считается, если не используются все 3 канала памяти на процессор или число модулей не кратно 3 модулям на процессор. Конфигурация, когда используется два канала из трех, можно считать сбалансированной, т.к. interleave работает, но только на 2 канала.

Так же возможна конфигурация, когда вся память находиться у одного процессора. Она возможна при использовании Non-Uniform Memory Access (NUMA).

image 
Примеры несбалансированных конфигураций

Сбалансированная конфигурация: задействовано больше каналов, выше пропускная способность памяти.

· Пропускная способность одинакова при использовании 1 модуля памяти на канал и при использовании 2х модулей на канал (как на DDR3 1066)

Несбалансированная конфигурация: уменьшенная пропускная способность (до 17%)

· Не работает Interleave во всех 3х каналах

· Приводит к снижению пропускной способности на 2-1-1 против 1-1-1 конфигурации

Пропускная способность памяти. Сравнение сбалансированной и не сбалансированной конфигурации (DDR3 1066).

image

Разница в скорости на разных конфигурациях

Очень хорошо видна разница в пропускной способности памяти в разных режимах:

Memory Frequency (MHz)

DIMM Population (CPU 0 / CPU 1)

STREAM Triad Result
4.8GT/s QPI

STREAM Triad Result
5.86GT/s QPI

STREAM Triad Result
6.4GT/s QPI

Balanced Configs

1333

1-1-1 / 1-1-1

---

---

36,588

1066

1-1-1 / 1-1-1

---

31,218

33,723

1066

2-2-2 / 2-2-2

---

30,912

33,203

800

1-1-1 / 1-1-1

24,265

26,750

27,748

800

2-2-2 / 2-2-2

23,866

25,844

26,565

800

3-3-3 / 3-3-3

24,052

26,750

27,208

Unbalanced Configs

1066

2-2-0 / 2-2-0

---

25,343

---

1066

2-1-1 / 2-1-1

---

25,679

---

1066

2-2-2 / 2-2-2

---

30,912

---

800

2-2-0 / 2-2-0

---

19,510

---

800

2-1-1 / 2-1-1

---

19,961

---

800

2-2-2 / 2-2-2

---

25,884

---

 

RAS Features

Еще хочется отметить некоторые особенности RAS, они используются редко, поэтому скажу буквально пару слов.

Memory mirroring (Зеркалирование памяти):

• 2 канала памяти, в качестве зеркала (одна информация записывается на обоих каналах одновременно)
• Модули памяти должны быть одинаковые
• Полезный объем памяти равен 50%
• Повышение надежности (память избыточна)

Технология Lockstep

Технология основывается на том, что взаимодополняющие компоненты системы выполняют параллельно одни и те же инструкции. Каждый из компонентов является активной заменой другому. Таким образом, если в одном из них происходит сбой, второй продолжает работу в прежнем режиме, при этом не происходит ни остановки, ни потери данных.

Lockstep mode

• 2 канала, работающих в lockstep (кэш линия разделяется между обоими каналами), 3 канал не используется.
• Модули памяти должны быть одинаковые
• Увеличение надежности, но низкая производительность

image Примеры работы RAS features

Технология Intel® x4 Single Device Data Correction (x4 SDDC) обеспечивает обнаружение и исправление ошибок размером 1, 2, 3 или 4 бит данных в одном устройстве и обнаружение ошибок размером до 8 бит данных на двух устройствах.

Материал был сделан, большой частью, Куликовым Дмитрием, за что ему выражается отдельная благодарность!

Для написания статьи использованы материалы Intel:
Xeon 5500 Memory White Paper Intel® Xeon® processor 5500 Series Datasheet: (public)

http://www.intel.com/Assets/PDF/datasheet/321321.pdf (Volume 1)
http://www.intel.com/Assets/PDF/datasheet/321322.pdf (Volume 2)

Читать дальше ...

вторник, 4 августа 2009 г.

Supermicro SuperServer 6016T-NTF

clip_image002

Новая одно-юнитовая платформа для CPU Nehalem на базе системной логики intel 5520, Supermicro SuperServer 6016T-NTF.

clip_image004

Вид сзади. Разъемы PS/2, IPMI network, USB, RS-232 COM, VGA, network.

clip_image006

На передней панели системы располагается кнопка идентификации платформы при нажатии, на которую сзади платформы загорается диод-идентификатор. Рядом с ней на передней панели диоды: идентификации (такая же кнопочка как спереди есть и сзади), сетевой активности, дисковой активности, питания. Кнопки перезагрузки и включения.

clip_image008
Высота системы 1U. Материнская плата Supermicro Super X8DTU-F. Спереди располагается четыре отсека для съемных дисков 3,5 дюйма, с другой стороны они подсоединены в корзину без экспандера. Корзина поддерживает горячую замену дисков. Диски могут быть SAS или SATA 3,5 дюйма. С помощью набортного RAID контроллера Intel ICH10R, SATA диски могут быть организованы в RAID 0, 1, 5, 10. Корзина поддерживает также и SAS диски, в случае необходимости их использования нужно добавить внешний PCIe контроллер.

clip_image010

Платформа со снятой крышкой. На внутренней стороне крышки изолированные вставки над компонентами, которые теоретически могут задеть крышку. Сделано во избежание короткого замыкания.

clip_image012

Снятый пластиковый кожух для оптимизации воздушного потока. Кожух сделан с вертикальными бортиками, которые имеют прорези в местах, где кожух пересекает радиаторы и прочие выдающиеся по вертикали компоненты.

clip_image014

В передней части корпуса расположены 4 маленьких вентилятора (40х56 мм, 4 пин, управляемые) обдувающих саму плату, ЦП и память. В правой части вместо них стоят пустые заглушки, поскольку там не расположено горячих компонент. Если в платформе размещать платы расширения, то рекомендуется заменить эти заглушки на вентиляторы, поскольку платы располагаются как раз за ними.

clip_image016

Видно, что на raiser располагаются 2 порта PCIe по 8 линий каждый. Возможна установка полноразмерных по высоте и длине плат. Это могут быть дисковые контроллеры, сетевые адаптеры или другие поддерживаемые платы PCIe.

clip_image018

На плате 2 разъема для CPU - Quad-Core Intel Xeon®Processor 5500 (Nehalem-EP). Поддерживается до 96 GB 1333/1066/800MHz DDR3 ECC Registered memory или до 24 GB 1333/1066/800MHz DDR3 ECC Unbuffered memory. Слева внизу расположен чип, обеспечивающий два сетевых порта из трех (если посмотреть на платформу сзади, это два правых порта).

clip_image020

Как было видно на фото выше в системе по умолчанию 4 вентилятора, еще 2 могут быть добавлены при необходимости. Они оборудованы резиновыми шайбами, для снижения вибрации платформы и общего уровня шума.

clip_image022

Заглушка, стоящая на месте двух самых правых, если смотреть сзади, вентиляторов. Также оснащена резиновыми шайбами.

 Без имени

На фото логика платформы: Intel 5520 реализующий основную логику (красная рамка), Intel ICH10R в качестве набортного RAID контроллера (синяя рамка) и чип BMC с IPMI (желтая рамка). Также видны два полнофункциональных USB порта (оранжевая рамка).

clip_image026

В системе один блок питания, расположенный на фото - слева. Для замены блока питания необходимо разобрать всю платформу и открутить крепежные винты. Быстрой замены блока питания не предусмотрено. В конце блока питания внутри платформы расположен пластиковый кожух, скрывающий провода, чтобы они не мешали потоку воздуха.

clip_image028

Снят кожух, закрывающий провода питания. Видна коммутация линий питания в плату с одной стороны и в дисковую корзину с другой.

clip_image030

Внешний вид радиатора под CPU для данной платформы.

clip_image032

Комплект поставки. Инструкция к плате, диск с ПО, рельсы для монтажа в шкаф и крепежные элементы, шнур питания, набор для монтажа Floppy, набор для монтажа CD-ROM, крепежные винты. Что любопытно на плате порта для Floppy не предусмотрено, куда подключать - неясно.

Читать дальше ...

среда, 29 июля 2009 г.

Supermicro 6026TT-IBXF

clip_image002

Новая платформа Supermicro 6026TT-IBXF.

clip_image004

В платформе используются четыре независимых вычислительных модуля, с общим электропитанием. Здесь конфигурация с одним из двух возможных БП.

image

Все модули вставлены вид сзади. У каждого модуля свои отдельные сеть, VGA, USB.

clip_image002[7]

Кнопки включения питания расположены для каждого сервера в отдельности.

image

Целиком вынутый модуль.

image

Все модули-сервера вынуты. В системе остались только вентиляторы и корзина с дисками.

clip_image005

Каждый модуль можно оснастить двумя высокопроизводительными процессорами Nehalem-EP. Ограничение для процессоров – термопакет, он не должен превышать 100W, но почти все процессоры удовлетворяют этому требованию.

clip_image010

На каждый модуль приходиться по 3 SATA диска. Этого достаточно для организации отказоустойчивого массива под систему. Жесткие диски связаны с конкретными модулями-серверами по слотам.

clip_image007

С памятью никаких необычных решений. Все штатно согласно функционалу чипсета, Intel 5500 (Tylersburg), 3 канала на процессор. На каждое лезвие максимально можно установить либо 48 Гб DDR3 ECC Registered DIMM, либо 24Гб Unbuffered. Частота 1333/1066/800 MHz.

clip_image008

В каждый модуль интегрирован IPMI, что упрощает управление сервером, позволяя полностью контролировать его через LAN. Так же на плате уже распаян Mellanox ConnectX DDR Infiniband 20Gbps Controller, наружу выведен разъем QSFP. Infiniband дает возможность организации быстрого интерконекта с низкой латентностью между серверами.

Все остальные решения совершенно стандартные для серверов на платформе Nehalem. За исключением использования в платформах с процессорами Nehalem-EP, моста ICH10R, в данном случае он используется для возможности собрать RAID массив.

clip_image012

Для тех кому не хватает дискового пространства или нужно что-то более производительное и надежное, каждый сервер оснащен PCI-E x16. Это позволяет  при необходимости установить дополнительные карточки для подключения массива по iSCSI или более дорогую FC, либо любую другую совместимую. Или все, что ваша душа пожелает, но карта должна иметь LP форм фактор.

clip_image014

Система вентиляции. Сразу за вентиляторами располагаются 2 сервера, друг над другом.

clip_image016

Сильно порадовало что все куллера больше не прикручены насмерть саморезами к железу. Все аккуратно сделано на резиновых фиксаторах, и с резиновыми прокладками. Это существенно уменьшает уровень шума и вибрацию.

clip_image018

Что касается питания в базовой комплектации модуль только 1 мощностью 1200W. Для избыточности нужно купить дополнительный.

clip_image020

Модуль для подключения двух БП. расположен в центре корпуса, между серверами-модулями.

clip_image022

Платформа в сборе с открытой крышкой. Под видимыми модулями-серверами располагается второй слой.

http://supermicro.com/products/system/2U/6026/SYS-6026TT-IBXF.cfm

Характеристики:

Four systems (nodes) in a 2U form factor. Each node supports the following:

1. Dual Intel® 5500 series Xeon® Quad/
    Dual-Core, with QPI up to 6.4 GT/s

2. Up to 48GB DDR3 1333/ 1066/ 800MHz
    ECC Registered DIMM

3. 1 (x16) PCI-E ( Low Profile)

4. Integrated IPMI 2.0 with KVM and
    Dedicated LAN

5. Mellanox ConnectX DDR Infiniband
    20Gbps Controller w/ QSFP connector

6. Intel® 82576 Dual-Port Gigabit
    Ethernet Controller

7. 3x Hot-swap SATA Drive Bays

8. 1200W Gold-level High-efficiency
   Power Supply

CPU
- Dual 1366-pin LGA Sockets
- Supports up to two Intel® 64-bit Xeon® processor(s) of the same type below:
      Quad-Core Intel®
      Xeon®Processor 5500 sequence (Nehalem-EP processor)

QPI
- up to 6.4 GT/s

System Memory (per Node)

Memory Capacity
- Twelve 240-pin DIMM sockets
- Supports up to 48 GB 1333 / 1066 / 800MHz DDR3 ECC Registered memory
- Memory Mirroring supported

Memory Type
- 1333 / 1066 / 800MHz Registered ECC DDR3 SDRAM 72-bit, 240-pin gold-plated DIMMs

DIMM Sizes
- 1GB, 2GB, 4GB

Memory Voltage
- 1.5 V

Height
3.5" (89mm)
Width
17.2" (437mm)
Depth
28.5" (724mm)
Gross Weight
85 lbs (38.6kg)

On-Board Devices (per Node)

Infiniband
- Mellanox ConnectX DDR Infiniband 20Gbps Controller

Chipset
- Intel® 5520 (Tylersburg) chipset
- ICH10R + IOH-36D

SATA
- Intel ICH10R SATA 3.0Gbps Controller
- RAID 0, 1, 5, 10 support

IPMI
- Support for Intelligent Platform Management Interface v.2.0
- IPMI 2.0 with virtual media over LAN and KVM-over-LAN support
- Winbond® WPCM450 BMC

Network Controllers
- Intel® 82576 Dual-Port Gigabit Ethernet Controller
- Supports 10BASE-T, 100BASE-TX, and 1000BASE-T, RJ45 output
- Intel® I/OAT 3 support for fast, scaleable, and reliable networking
- VMDq support for better performance of virtualization
- 1x Realtek RTL8201N PHY (dedicated IPMI)

Graphics
- Matrox G200eW 8 MB DDR2

Super I/O
- Winbond W83527HG chip

Clock Generator
- 932S421 chip

Input / Output
Serial ATA
- Six Serial ATA ports
- 3 SATA hard drives supported

LAN
- 2x RJ45 LAN ports
- 1x RJ45 Dedicated IPMI LAN port

USB
- 2 rear + 1 header (2 Ports)
- 4 total USB ports, 2.0 Compliant / 1.1 Compliant

VGA
- 1x VGA Port

Serial Port
- 1 Fast UART 16550 serial port

Infiniband
- 1 External QSFP Infiniband Connector

Отдельное спасибо Куликову Диме за помощь в подготовке.

Читать дальше ...