Er Nehalem en tøj-tiger?

Jeg har rodet med en Intel Nehalem (Core i7) Linux-maskine i dag. Normalt arbejder jeg med en Quad Core E5450@3 GHz. Den nye Nehalem viser sig som en 16 søms L5520 maskine og den kører ved 2,27 GHz.

Jeg har prøvet at compile en solid sjat kode på begge maskiner i parallel - og sjovt nok ramte de indenfor 2-3% mht. total compile-tid.
Tilsvarende har jeg leget med noget simuleringskode - også her er de to maskiner fuldstændig on par i mit eksempel. Mit simulerings-eksempel er meget mono-core og meget regne-tungt.

Jeg er interesseret i tilsvarende erfaringer, da ovenstående var noget deprimerende - især efter at have læst denne version2-artikel. Og når pris og effektforbrug også skal tages ind som parametre i en overvejelse om hvordan man laver en højtydende Linux-box, så kan jeg ikke her se et kvantespring fra Intel. Min erfaring er dog baseret på mine første simuleringer, så det kan da være jeg har overset noget - jeg håber egentlig det er tilfældet. Jeg forventer selvfølgelig at Nehalem leverer noget markant hurtigere end forrige generations CPU'er - naturligvis givet at vi installerer styresystem, compilere osv som passer til den CPU. Jeg anvendte Red Hat 5.3 i det her tilfælde.

Er der nogle specielle Linux/GCC compile-options, man med fordel kan og bør bruge på en Nehalem' Er der ide i at rode med Intels egen C/C++ compiler her'

Hvad er jeres erfaringer' Er Nahalem en tøj-tiger eller rigtig tiger'

/pto

Kommentarer (8)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#1 Esben Bach

Jeg læste fornyligt en længere gennemgang af Nehalem på AnandTech (http://it.anandtech.com/IT/showdoc.aspx?i=3536) jeg har ikke selv nogen erfaring med den men, givet at AnandTech's tal er rigtige, så er der ikke meget at hente på regnkrafts siden. Det ser ud somom den nok "bare" er bedre til at jonglere med data in transit, cache osv. Kig f.eks. på deres LINPACK test - der er ikke meget at vinde tilsyneladende.

  • 0
  • 0
#2 Dennis Schafroth

16 søms maskine?

Er det en dual CPU using HT?

Jeg har ikke selv prøvet en Nehalem endnu, men er ejer af en 8 core 2.8 GHz Mac Pro.

Jeg synes at den får bank af fire core maskine i visse tests og 8 core 2.26GHz maskine i mange. Er det ikke meget godt af en 20% langsommere (GHz) CPU?

  • 0
  • 0
#3 Peter Toft

Yeps - det er HT delen som ganger med 2.

Du har naturligvis en pointe i at jeg sammenligner en langsommere i7 med en hurtigere Quad Core, og det må forventes at i7 kommer i hurtigere versioner. Jeg mener at huske, at der findes en ~3 GHz version, men det giver kun ~30% mere, hvis vi skruer op.

Er der nogen der ved om der er forventning om at i7 ville kunne clockes hurtigere end Quad Core-versionerne? Det lugter pt. af at 3 GHz er en grænse, der er svær at komme over.

  • 0
  • 0
#4 Anders Norgaard

"Det lugter pt. af at 3 GHz er en grænse, der er svær at komme over."

Jeg ved ikke helt hvad du mener, men det er vist ikke svært at overclocke sig over (har dog ikke selv prøvet).

"Core i7-920 has become the most popular CPU in the Core i7 series. The reason for this high demand is very simple: it is the cheapest LGA1366 processor with an excellent overclocking potential. According to the overclocking statistics, with air-cooling these CPUs can reach 3.8-4.0GHz with Hyper-Threading technology enabled or 4.0-4.2GHz with this technology disabled."

http://www.xbitlabs.com/articles/memory/display/corsair-ddr3-1600_3.html...

  • 0
  • 0
#6 Jesper Stein Sandal

Hej Peter

Den software, Intel viste frem på deres Xeon-maskiner (er Turbo Boost kun tilgængelig på Xeon-udgaven af Nehalem eller også på Core i7?), var kommerciel software. Så der er højst sandsynligt tale om 1) softwareoptimering og 2) BIOS-optimering.

For Xeon 5500-processorerne var det helt tydeligt, at du skulle have en optimeret BIOS for at få udbytte af eksempelvis Turbo Boost og strømsparefunktionerne. HP fortalte eksempelvis, at de havde lavet en masse optimeringer til Nehalem i deres BIOS.

Så Intels påstande om massive forbedringer skal nok tages med et gran salt - i hvert fald hvis man kun opgraderer processoren.

  • 0
  • 0
#7 Dennis Schafroth

Du kan allerede nu få en 3,2 GHz (W5580) til en listepris af $1600/stk (ved køb af tusinde).

Den har en lidt hurtigere QPI 6,4 GHz.

Men den har også en TPD 130W imod dine nuværende 60 watt.

Men til compilering, vil det ikke være disken der er flaskehalsen allerede for din quad core?

  • 0
  • 0
#10 Jesper Louis Andersen

Du skal se på hvor mange af dine cores du får i spil. Du kan parallellisere noget af et compile, men ikke alt. Og hvis du kun kan få 7 cores i spil, så hjælper det jo ikke at der sidder 9 andre og triller tommelfingre.

De 4 barrierer er:

Kompleksitet. Vi kan simpelthen ikke regne ud hvad der sker i CPU'en eller hvordan den skal forbedres.

ILP. Vi kan ikke finde mere dynamisk parallellisme i programmerne (Se out-of-order scheduling)

Power. Dyret bruger for meget strøm og varmen skal ledes væk.

Memory. Hukommelsen er for langsom i forhold til CPU'en. Jo større afstand, desto mere vil CPU'en bare sidde og idle det meste af tiden.

Den vej som der pt satses på er at smide flere cores ned ved siden af hinanden. Men det er ikke givet at det hjælper det store. Dit problem skal have en parallellisme som passer til de ekstra cores.

  • 0
  • 0
Log ind eller Opret konto for at kommentere