インテル Pentium4 LGA775 プロセッサー。 インテル Pentium 4 プロセッサー
去年 インテル新しいカーネルをリリースしました - プレスコット- のために ペンティアム4の特徴は、 90 -nm 技術プロセス、レベル 2 キャッシュが次のように増加しました。 1 MB、さらに説明書一式が登場 SSE3。 同時に一般公開もされました Pentium 4 エクストリーム エディション 3,4 GHz 2 MB レベル 3 キャッシュ。 プラットフォームは夏に発表された ソケット 775プロセッサからの脚がソケットに「切り替わった」ため、これに興味がありました。 新しいコネクタに加えて、チップセットも受け取りました i915そして i925、誰もが喜んで満足した一連の関数: DDR2 SDRAM, PCIエクスプレスグラフィックスと周辺機器、サウンド用 HDA, 無線LAN, マトリックスRAID等 同じ頃、Intel はモデル番号を導入しましたが、それ以前はまだ手を出していただけでした。 AMD。 そして私たちはそのラインに慣れる必要がありました セレロン 3xx, ペンティアム4 5xx.
しかし、新しい Prescott コアには高い熱放散という問題があり、 115 最上位モデルの場合は W。 同時に、コアと比較したパフォーマンス ノースウッド実質的には増えなかった。 一方、競合他社は眠らず、AMDはコアを提示しました ウィンチェスター発熱が少ないのが特徴でした。 さらに、同社はユーザーにテクノロジーで賄賂を贈った クールで静かな(低負荷時の周波数と電圧の低減)、 NXビット(バッファ オーバーフローによるコードの実行を防止) および x86-64(64 ビット拡張)。
その結果、Prescott は何度も修正され、多くのプロセッサステッピングが生まれました。 しばらくして、インテルのエンジニアはステッピング機能を備えたバランスの取れたプロセッサーを発表しました。 E0。 新興テクノロジー 温度監視 2過熱に対する保護が強化されました - 発熱が臨界限界に達した場合、プロセッサーは周波数と電圧を下げ始めました。 同じ状況でプロセッサがクロック パルスを逃した場合、このアプローチはスロットリングよりも優れています。 ただし、極端な場合には依然としてオンになります。 Thermal Monitoring 2 テクノロジーはアイドル モードでも動作して熱放散を低減できますが、これには設置が必要です サービスパック2。 新たなステッピングに登場 XDビット、悪意のあるコードの実行を禁止する機能を実行しますが、これにも SP2 が必要です。 この機能をサポートするプロセッサには、接尾辞が付けられます。 J。 外観 64 -bit 拡張子 EM64T 500ラインのE0ステッピングでは一度も見たことがありません。
ただし、その時までにプロセッサを導入していた AMD を思い出してください。 Athlon 64 4000+そして FX-55。 後者はゲーマーにとって最高のプロセッサであり、究極のゲーム パフォーマンスを提供することが判明しました。 Intelはチップセットをリリースすることでこの攻撃に対抗した i925XEそして Pentium 4 エクストリーム エディション 3.46 GHz(システムバスあり) 1066 MHz。 新しい P4 EE のその他の特性は変更されていません: L2 キャッシュ 512 KB、L3 - 2 MB(コア ギャラティン)。 ああ、$という極端な価格で 999 この新人は、ほとんどのゲームテストで FX-55 に負けました。
2005 年初めの状況を簡単に説明します。
スピードステップの動作 |
テクノロジー スピードステップ許可します ウィンドウズプログラムでインターフェイスを使用する ACPI低負荷時にはプロセッサのクロック速度を 2.8 GHz に下げます。 SpeedStep が動作するには、次の条件が必要です。
当社の ASUS P5AD2-E Platinum (i925XE) マザーボードは、SpeedStep を完全にサポートしています。 |
SpeedStep に関する結論は次のとおりです。ゲームの場合は完全にオフにし、オフィスやその他の仕事の場合はオンにするのがよいでしょう。 そうすれば、プロセッサはより低い周波数で動作し、発熱も少なくなります。
Pentium 4 の新たなページ: 600 番目のモデル
新しいものとの最も重要な違いは、 ペンティアム6xx- L2キャッシュを増やす 2 MB 新しいプロセッサ シリーズ全体が XD-bit をサポートしています。 エネルギー管理テクノロジがさらに向上しました。E0 ステッピングがサーマル モニタリング 2 を誇ることができれば、新しいプロセッサにはテクノロジが追加されています。 強化された SpeedStep、これまでは同社のモバイルプロセッサでのみ使用されていました。 プロセッサーの負荷が軽い場合は、電圧と周波数を下げることができます。 2 つのテクノロジの主な違いは、後者の場合、周波数を下げる「開始者」がプロセッサではなくオペレーティング システムであることです。
すべての Pentium 6xx は 64 ビット EM64T 拡張機能 (AMD の x86-64 拡張機能に類似) をサポートしています。 ただし、この機能は次の場合にのみ役立ちます。 Windows XP 64ビット版。 しかし、この OS が正式に登場した後でも、AMD と Intel ユーザーの問題は解決しません。実際、OS、ドライバー、プログラムが 64 ビットである場合にのみパフォーマンスが向上します。 しかし、これには大きな問題があり、新しいテクノロジーの成果をいつ利用できるようになるかを言うことさえ困難です。 一方、インテルがこの問題に取り組んだ場合、プロセスははるかに迅速に進むでしょう。
EM64T テクノロジーは 5xx シリーズの一部のモデル (数字の最後に「1」が付きます) にも搭載される予定ですが、強化されたスピード ステップは 6xx ラインの独占的な機能のままであることも言っておかなければなりません。
物理的には、Pentium 4 6xx ラインのダイは 5xx のダイよりも大幅に大きくなります。 169 何百万ものトランジスタと 135 mm2 対 125 何百万ものそして 112 mm2。
新しい P4 Extreme Edition モデルは非常に興味深いです。 残念ながらPentium 4 Extreme Edition 3,46 2004 年 11 月にリリースされた GHz は期待に応えられなかったため、廃止されました。 新しい P4 Extreme Edition に置き換えられました 3,73 GHz、通常の 6xx プロセッサですが、システム バス周波数を持ちます。 1066 MHz。 2次キャッシュは同じ2MBですが、3次キャッシュには別れを告げなければなりませんでした。
6xx ラインは、同じクロック周波数の 500 モデルよりも高価になることに注意してください。
|
|
|
周波数競争は終わった
長年にわたり、私たちはプロセッサのメーカーが定期的にクロック速度の向上を喜んでくれるという事実に慣れてきました。この指標は最前線にありました。 2004 年末までに、インテルは Pentium 4 を定期的にリリースする予定でした。 4 GHzですが、表示されませんでした。 同社のエンジニアと経営陣は、幸せはギガヘルツ単位ではなく、特に周波数の増加がシステムのパフォーマンスの比例的な向上につながらないため、周波数を常に増加させることはまったく不可能であることに気づきました。
AMD についても状況は同様です。今年、そのしきい値を超えるプロセッサが登場する可能性は低いでしょう。 3 GHz。 最新の Athlon 64 の速度が 2,6 GHz 周波数はインテル製品とうまく競合します。
両社は現在、新技術の採用や機能の拡張により、プロセッサの効率と性能の向上に取り組んでいる。 クロック速度の競争は終わりました。 実際、6xx シリーズはその好例となりました。
|
|
結論
5xx ラインと 6xx ラインを比較すると、結論は明確になります。キャッシュ サイズが 2 倍になってもパフォーマンスには特に影響しませんが、新しいバージョンのプロセッサの方が優れています。 しかし、EM64T、XD-bit、Thermal Monitoring 2、Enhanced SpeedStep などの機能のおかげで、新しい Pentium 4 は非常に有望に見えます。 高性能、一連の優れた追加機能、および適度な消費電力により、状況は大きく変わります。 さらに、新製品は、すでに使い慣れた Socket 775 のマザーボードと完全に互換性があり、BIOS をアップデートするだけで済みます。
この時点まで、Intel は新しいテクノロジーの導入がやや遅かったと非難される可能性があります。AMD は 64 ビット拡張機能をはるかに早く実装しましたが、それによる実際の利点はまだ明らかではありません。 AMD の所有者も、かなり昔に NX-bit と Cool"n"Quiet を目にしました。
しかし、インテルがなぜ新しいプロセッサーにこれほどの高額な価格を発表したのかは依然として不明であり、古いバージョンよりも大幅に高価です。
いずれにせよ、今後数か月間で、デュアルコア プロセッサ、Vanderpool 仮想化テクノロジ (VT) など、Intel の Pentium 4 シリーズに対するさらに抜本的なアップデートが期待されるはずです。
周知のとおり、コンピュータの革命
世界で起こることはますます少なくなっています。 そして、それらは一般的に「誰もが」という場所で本当に必要なのでしょうか?
「良い」、システムと製品の機能が大多数のニーズを十分にカバーしている場合
現代のユーザー。 これは企業の処理業者に完全に当てはまります。
業界のリーダー、インテル。 同社は高性能製品の全製品を取り揃えています
あらゆるレベルの CPU (サーバー、デスクトップ、モバイル)、クロック速度は長い間使用されてきました。
3 GHz の「空高く」を超え、販売は「爆発的に」進んでいます。
そしておそらく、復活した競合他社がいなかったら (より正確には、 競合他社選手)、それでは終わりです
それは本当に良いことだろう。
しかし、「ギガヘルツ競争」は止まらない。 」のような疑問についての考察は脇に置いておきましょう。 誰がそれを必要としているでしょうか?" そして " これはどのくらい需要があるのでしょうか?「――事実として受け入れましょう。CPU メーカーは存続するために、より高速に (または少なくともより高速に) 生産することに努力を費やす必要があるだけです。」 高周波) 製品。
インテルは 2 月の初めに、さまざまな新しいプロセッサーを発表しました。 会社
は、次のような 7 つの新しい CPU を一度にリリースしました。
- Pentium 4 3.40 GHz (「古い」Northwood コア)。
- Pentium 4 Extreme Edition 3.40 GHz;
- Prescott コアを備えた新しいラインの代表者は 4 人もいます (ちなみに、強調
最初の音節) - 3.40E、3.20E、3.0E、2.80E GHz、90 nm で製造
テクノロジーを採用し、1MBの2次キャッシュを搭載。
これらの CPU はすべて 800 MHz バス用に設計されており、ハイパー スレッディング テクノロジをサポートしています。 さらに、Intel は、周波数 2.8A GHz の Prescott コア上の Pentium 4 をリリースしました。これも 90 nm プロセスを使用して製造されていますが、FSB 周波数 533 MHz 向けに設計されており、 ハイパースレッディングをサポートしていない。 Intelによると、このプロセッサはPC OEMの要望に応え、PC OEM向けに特別に設計されたという。 私たち自身のために、そしてそのオーバークロック機能を高く評価するオーバークロッカーの喜びのために付け加えさせてください。
新しい CPU のリリースにより、Pentium 4 ファミリは大幅に拡張され、表に示すようになりました。 1. 当然のことながら、Intel は FSB 533 および 800 MHz の Northwood コアをベースとした Pentium 4 の生産を削減するつもりはありません。 さらに、400 MHz バス用に設計されたいくつかのモデル (2A ~ 2.60 GHz の 5 つのプロセッサ) が引き続きラインナップされています。
90nm テクノロジーを開発することで、通常の機能を提供できるようになります。
Prescott クラスのプロセッサーが機能しなくなると、インテルのエンジニアは強制的に
重大な障害を克服しなければならなかった。 これらの障害の性質は、
生産設備の解像度不足ではなく、問題がある
このような小さなものを製造することが不可能であることに伴う物理的性質
伝統的な技術を使用したトランジスタ。
最初に現れたのは、薄層化されたトランジスタのゲートからの電荷の漏れでした。
ゲートとチャネル間の誘電体層。 90nmの解像度では「縮退」します
厚さ 1.2 nm の 4 つの SiO2 原子の障壁に。 需要がある
より高い誘電率を持つ新しい絶縁材料で
透過性(High-K誘電体)。 浸透性が高いため、
障害物を作らずに厚い(最大 3 nm)絶縁層を構築します
ゲート電界用。 これらはハフニウムとジルコニウムの酸化物です。
残念ながら、それらは現在使用されている多結晶とは互換性がないことが判明しました。
ゲートと誘電体内で発生するフォノン振動が原因
チャネル内の電子移動度の減少。
ゲートとの境界では、別の現象が観察され、それが顕著に表現されます。
状態を変更するために必要なしきい値電圧レベルを増加させる
トランジスタチャネルの導電率。 溶液は金属の形で発見されました
シャッター 昨年、同社の専門家が最終的に2名を選出した。
適切な金属により、新しいミニチュアの設計が可能になりました
NMOS トランジスタと PMOS トランジスタ。 彼らはどのような金属を使用しましたか?
まだ秘密にされています。
トランジスタの速度を上げる(速度によって決まります)
オープン/クローズ状態への移行)、インテルは形成に頼った
ひずみシリコンの単結晶からのチャネル。 "電圧"
この場合、「材料の結晶格子の変形」を意味します。
結局のところ、構造的に損傷したシリコンを通して、両方の電子 (+10%)
NMOS の場合)およびホール(PMOS の場合 +25%)は、より低い抵抗で通過します。
移動度が向上すると、オン時の最大トランジスタ電流が増加します。
状態。
NMOS トランジスタと PMOS トランジスタの場合、電圧状態はさまざまな方法で実現されます。
方法。 最初のケースでは、すべてが非常に単純です。通常、トランジスタが上にあります。
保護層として機能する窒化ケイ素の層で「覆われ」ています。
マスクを使用し、チャネル内に電圧を発生させるために、窒化物層の厚さが増加します。
倍増した。 これにより、ソース領域に追加の負荷が発生します。
排水し、それに応じてチャネルが伸びて変形します。
PMOS トランジスタは、別の回路に従って「電圧」をかけられます。 最初にゾーン
ソースとドレインがエッチングされ、その後、それらの中にSiGe層が成長します。 原子
ゲルマニウムはシリコン原子のサイズを超えるため、ゲルマニウム層が形成されます。
シリコン内に電圧を生成するために常に使用されてきました。 ただし、その特異性は、
インテルのテクノロジーとは、この場合はシリコンの圧縮です。
チャネルは縦断面で発生します。
新しい技術プロセスにより、層の数を増やすことも可能になりました
メタライゼーションが 6 から 7 に (銅接続)。 不思議なのは、制作時に
「肩から肩まで」の線は石版印刷機のように機能します
波長 193 nm の新世代と、波長 193 nm のその前世代
波248nm。 全体として、再利用機器の割合は 75 に達し、
これにより、工場の近代化コストを削減することができました。
プレスコットの特徴
Prescott コア プロセッサのリリースに至るまでの議論では、それは冗談めかして「Pentium 5」と呼ばれていました。 実際、これはまさに「Prescott とは何ですか?」という質問に対するコンピューターのプロからの典型的な答えでした。 もちろん、インテルは商標を変更しませんでしたが、これには十分な理由がありませんでした。 ソフトウェア リリースの慣行を思い出してください。バージョン番号は製品が根本的に再設計された場合にのみ変更され、それほど重要ではない変更は小数点以下のバージョン番号で示されます。 プロセッサ業界ではまだ分数は受け入れられておらず、Prescott が Pentium 4 ラインを継続したという事実は、まさに変化がそれほど急進的ではないという事実を反映しています。
Prescott コアをベースとしたプロセッサですが、比較すると多くの革新と変更が含まれています
Northwood と同じですが、同じ NetBurst アーキテクチャに基づいており、同じパッケージ化が施されています。
以前の Pentium 4 と同様に、同じ Socket 478 コネクタにインストールされており、原則として、
800 MHz FSB をサポートするほとんどのマザーボードで動作するはずです。
適切な電源電圧を提供します (もちろん、アップデートが必要になります)
BIOS)。
Prescott に関連する実際的な問題の詳細な研究については、別の資料に残しておきます。 それまでの間、Prescott にどのような変更が加えられたかを見て、このプロセッサが以前のプロセッサとどのように異なるのか、そしてその結果何が期待できるのかを理解してみましょう。
Prescott コアに実装された主な革新は次のとおりです。
- 結晶生産を90nmプロセス技術に移行。
- コンベア長さを増加(20段→31段)。
- L1 キャッシュ (データ キャッシュ - 8 KB から 16 KB) と L2 キャッシュ (データ キャッシュ - 512 KB から 16 KB へ) が 2 倍になりました。
1MB)。 - アーキテクチャの変更:
-修正された遷移予測ブロック;
- L1 キャッシュ ロジックの改善 (プリフェッチの改善)
データ);
-プロセッサ内の新しいブロックの出現。
-一部のバッファの容量を増加しました。 - 高度なハイパースレッディングテクノロジー。
- SIMD 命令 SSE3 の新しいセット (13 の新しいコマンド) のサポートが追加されました。
Pentium 4 で使用される 3 つのプロセッサ コアの主な違いを表にまとめます。 2. Prescott のトランジスタ数は 2 倍以上に増加しました。大まかな推定によれば、このうち約 3,000 万個は L2 キャッシュの倍増によるものと考えられます (追加の 512 KB、セルあたり 6 個のトランジスタ)。 さらに、まだかなりの数が残っており、この値だけでも、カーネル内で発生した変更の規模を間接的に判断できます。 このように要素数が増加したにもかかわらず、コア面積は増加しなかっただけでなく、 減少したノースウッドと比べて。
と 90nmプロセス技術一般に、すべてが理解可能です (もちろん、単純化された「ユーザー」レベルで)。 トランジスタのサイズが小さくなると、プロセッサの電源電圧が低下し、消費電力が減少し、結果として発熱が減少します。 これにより、クロック周波数のさらなる増加への道が開かれ、熱放散の増加が伴いますが、この増加の「基準点」は異なり、若干低くなります。 ノースウッドと比較してプレスコットのトランジスタの数が多いことを考慮すると、削減についてではなく、 保存または 低倍率消費された電力。
拡張コンベヤ。 表からもわかるように。 2、プレスコットのパイプライン長(31段)はノースウッドの半分以上である。 この背後にあるものは非常に明らかです。インテルがクロック周波数の増加を目的としてパイプラインの長さを増やしたのはこれが初めてではありません。パイプラインが長くなるほど、プロセッサー・コアの「オーバークロック」が向上することが知られています。 原則として、現段階で、3.5 GHz 付近の周波数でそのような「拡張」が本当に必要かどうかを明確に言うことは困難です。熱心なオーバークロッカーは、Pentium 4 (Northwood) をより高い値にオーバークロックしました。 しかし、遅かれ早かれ、ステージ数の増加は避けられないでしょう。そこで、このイベントを新しいカーネルのリリースと組み合わせてみてはいかがでしょうか?
キャッシュとバッファのサイズの増加。 原則として、この点は前の点と直接関連しています。 長いパイプラインが高周波数で動作することを保証するには、キャッシュの形式でより大きな「便利なウェアハウス」を用意し、必要なデータがメモリからロードされるまでプロセッサが待機するアイドル時間の数を減らすことが望ましいです。 さらに、他の条件がすべて同じであれば、パイプラインの長さが異なる 2 つのプロセッサのうち、このパラメータが短いプロセッサの方が生産性が高いことはよく知られています。 分岐予測エラーが発生すると、プロセッサはパイプラインを「リセット」し、新しい方法で作業をロードする必要があります。 そして、含まれるステージの数が多ければ多いほど、そのような間違いはより痛ましいものになります。 もちろん、それらを完全に排除することはできません。同じ周波数でも、Northwood と Prescott の生産性は低かったでしょう...もし、ラグを大幅に補う大規模な L2 キャッシュがなかったら。 当然のことながら、ここでのすべては特定のアプリケーションの詳細に依存するため、実際の部分で確認してみます。
前述したように、Prescott は全体的な L2 キャッシュだけでなく、L1 データ キャッシュも増加し、そのサイズは 8 KB から 16 KB に増加しました。 仕組みが導入されるなど、組織や作業ロジックの一部も変更されました。 強制昇進 (強制転送)。これにより、データをキャッシュに配置する前の操作が完了する前に、キャッシュからデータをロードする依存操作が投機的に完了できない場合のレイテンシが短縮されます。
キャッシュの量に加えて、マイクロ操作の保存を担当する 2 つのスケジューラの容量 ( うおっ)、x87/SSE/SSE2/SSE3 命令で使用されます。 これにより、特にマルチメディア アルゴリズムの並列性をより効率的に見つけて、より優れたパフォーマンスで実行できるようになりました。
実際、Prescott に実装された Pentium 4 アーキテクチャの革新性の一部についてはすでに触れました。これらの革新性はプロセッサ コア全体に「分散」され、そのブロックの多くに影響を与えるからです。 次の重要な変更は...
修正された分岐予測ブロック。 周知のとおり、精度は
高いパフォーマンスを確保するには、このユニットの動作が重要です
最新のプロセッサ。 次のプログラムコードを「調べてみる」
現在実行中のプロセッサは、 あらかじめパートを実行する
このコードはよく知られています 投機的実行。 もし
プログラムは、条件付きジャンプの結果として分岐に遭遇します ( if-then-else),
その場合、2 つの分岐のうちどちらを事前に実行するのが「より良い」かという疑問が生じます。
Northwood のアルゴリズムは比較的単純でした。 戻る想定されていた
ハプニング、 フォワード- いいえ。 これはほとんどの for ループで機能しましたが、
ただし、他のタイプのトランジションには適用されません。 プレスコットはコンセプトを使用しています 長さ
遷移: 研究によると、横断距離が超過すると、
ある一定の限界を超えると、高確率で遷移が起こらなくなる
(したがって、コードのこの部分を投機的に実行する必要はありません)。 プレスコットにもあります
移行条件自体のより徹底的な分析が導入されており、それに基づいて
移行の可能性に関する決定。 静的予測アルゴリズムに加えて、
動的アルゴリズムも変更されました(ちなみに、新しいアイデアは部分的に変更されました)
モバイル Pentium M から借用)。
プロセッサ内の新しいブロックの出現。 Prescott の 2 つの新しいブロックは次のとおりです。 ビット シフトと巡回シフトのブロック(シフター/ローテーター)および専用 整数乗算ブロック。 1 つ目では、CPU コア周波数の 2 倍で動作する 2 つの高速 ALU の 1 つで最も一般的なシフト演算を実行できます (Pentium 4 の以前の修正では、これらの演算は整数演算として実行され、数クロック サイクルかかりました)。 整数乗算を実行するには、以前は FPU リソースが使用されていましたが、これには非常に長い時間がかかりました。データを FPU に転送し、そこで比較的遅い乗算を実行し、結果を返送する必要がありました。 これらの演算を高速化するために、Prescott はそのような乗算演算を担当する新しいブロックを追加しました。
改良されたハイパースレッディング。 もちろん、上記に列挙したすべてのイノベーションは、理由があって Prescott に導入されました。 Intel の専門家によると、キャッシュやコマンド キューなどのロジックの変更のほとんどは、ハイパー スレッディングを使用するとき、つまり複数のプログラム スレッドが同時に実行されているときのプロセッサのパフォーマンスに何らかの形で関連しています。 同時に、これらの革新はシングルスレッド アプリケーションのパフォーマンスにわずかな影響しか与えません。 Prescott 氏はまた、プロセッサ上で並列実行が「許可される」命令セット (たとえば、ページ テーブル操作やキャッシュ ラインを分割するメモリ操作) を増やしました。 繰り返しになりますが、シングル スレッド アプリケーションの場合、このような操作を組み合わせられないことはパフォーマンスに事実上影響を与えませんでしたが、2 つのスレッドを実行する場合には、そのような制限がボトルネックになることがよくありました。 もう 1 つの例は、Northwood でキャッシュ ミスが発生し、RAM からデータを読み取る必要がある場合、そのアクションが完了するまで次のキャッシュ ルックアップ操作が遅延することです。 その結果、あるアプリケーションが頻繁にキャッシュをミスすると、他のスレッドの動作が大幅に遅くなる可能性があります。 Prescott では、この矛盾は簡単に克服され、操作を並行して実行できます。 また、Prescott では、全体的なパフォーマンスを向上させるために、スレッド間の調停とリソース共有のロジックが再設計されました。
SSE3の説明書。覚えているとおり、前回の SIMD 命令セットの拡張
Intel は、最初の Pentium 4 (Willamette) をリリースし、それに SSE2 を実装することで実行しました。
次の拡張機能は SSE3 と呼ばれ、13 個の新しい命令が含まれています。
プレスコットで行われました。 3 つを除いて、すべて SSE レジスタを使用します。
次の領域のパフォーマンスを向上させるように設計されています。
- 実数から整数への高速変換 ( こぶし);
- 複雑な算術計算 ( addsubps、addsubpd、movsldup、movshdup、
モブダップ); - ビデオエンコーディング ( lddq);
- グラフィックス処理 ( haddps、hsubps、haddpd、hsubpd);
- スレッドの同期 ( モニター、待機).
当然のことながら、すべての新しい命令の詳細な説明はこの資料の範囲を超えており、この情報は対応するプログラマ マニュアルで提供されます。 最初の 4 つのカテゴリの命令は、操作自体の実行を高速化し、プロセッサ リソースを使用するという意味で操作をより「経済的」にする (したがって、ハイパー スレッディングと投機的実行メカニズムの操作を最適化する) の両方に役立ちます。 。 プログラム コードも大幅に削減され、重要なことに、簡素化されています。 たとえば、実数を整数にすばやく変換する命令 こぶし従来のコードの 7 (!) コマンドを置き換えます。 SSE2 命令 (それ自体もコードの実行を高速化し、コード サイズを削減します) と比較しても、SSE3 命令は多くの場合、大幅な節約を実現します。 最後のグループの 2 つの命令 - モニターそして 待ってください— アプリケーションを許可します(より正確には 流れ)プロセッサが現在有用な作業を行っておらず、スタンバイ モードであることをプロセッサに通知します(たとえば、特定のメモリ位置に書き込み、割り込みまたは例外を引き起こします)。 この場合、プロセッサを低電力モードに切り替えるか、ハイパースレッディングを使用する場合はすべてのリソースを別のスレッドに与えることができます。 一般に、SSE3 により、コード最適化の新たな機会がプログラマーに開かれます。 このような場合にはいつもそうなのですが、ここでの問題は 1 つです。新しい命令セットが一般に受け入れられる標準になるまで、ソフトウェア開発者はアプリケーションが動作するために 2 つのコード ブランチ (SSE3 を使用する場合と使用しない場合) を維持する必要があります。 みんなプロセッサー...
どこに来ますか?...
一般に、Prescott コアに実装されたイノベーションの量は次のようになります。
重要な。 「本物の Pentium 5」には及ばないものの、
「4年半」はかなり近いかもしれない。 ノースウッドコアからの移行
プレスコットへ - 原理的には、一般的な概念によく適合する進化のプロセス
インテルの戦略。 Pentium 4 アーキテクチャの段階的な変化は、次の図ではっきりと確認できます。
スキーム: アーキテクチャが変更され、新しい機能で更新されます。一貫したスキームが存在します。
特定のソフトウェアセットに対する CPU の最適化。
プレスコットには何を期待できますか? おそらく、まず第一に(これはやや奇妙に思えるかもしれませんが)、新しい周波数です。 Intel 自体も、同じ周波数では Prescott と Northwood のパフォーマンスにほとんど差がないことを認めています。 Prescott の大規模な L2 キャッシュとその他の技術革新によるプラスの影響は、分岐予測エラーの影響を受けやすい非常に長いパイプラインによって大きく相殺されます。 そして、この遷移予測子のブロックが改善されたという事実を考慮しても、依然として理想的とは言えません。 Prescott の主な利点は異なります。新しいコアにより、Northwood では以前は達成できなかった値まで周波数をさらに高めることができます。 Intelの計画によると、Prescottコアは、65nm(0.065ミクロン)テクノロジーを使用して製造された次のコアに置き換えられるまで2年間持続するように設計されています。
したがって、現在リリースされている新しい Prescott コアのプロセッサーは、最初からパフォーマンス チャンピオンの栄光を直接主張するものではなく、将来的にその栄光をすべて発揮するはずです。 このことのもう 1 つの裏付けは、プロセッサの位置付けです。Prescott コアの Pentium 4 は主流のシステム向けに設計されていますが、最上位の CPU は今も昔も Pentium 4 Extreme Edition です。 ちなみに、Intel プロセッサの周波数バーは、Prescott のリリースにより名目上 3.4 GHz まで上昇しましたが、新しいコア上の Pentium 4 3.4 GHz をベースにした最初の OEM システムの登場は、今四半期後半 (および商用化) に行われる予定です。 Prescott の納入は 2003 年の第 4 四半期にすでに開始されています)。
Prescott が輝ける (そしておそらくそうなる) もう 1 つの領域は、SSE3 に最適化されたソフトウェアの実行です。 最適化プロセスはすでに開始されており、現在、MainConcept (MPEG-2/4)、xMPEG、Ligos (MPEG-2/4)、Real (RV9)、On2 (VP5) の少なくとも 5 つのアプリケーションが新しい命令セットをサポートしています。 /VP6) 。 2004 年中に、Adobe Premiere、Pinnacle MPEG Encoder、Sony DVD Source Creator、Ulead MediaStudio および VideoStudio、さまざまなオーディオおよびビデオ コーデックなどのパッケージで SSE3 のサポートが開始される予定です。SSE/SSE2 の最適化プロセスを思い出すと、次のことが理解できるでしょう。 SSE3 の結果はこれからわかりますが、すぐにはわかりません。繰り返しになりますが、これはある意味で「未来のスタートアップ」です。
では、「最前線の向こう側」はどうでしょうか? Intelの主な競合他社は依然として独自の道を歩み、「一般的な路線」からますます遠ざかっている。 AMDは「最低限のパフォーマンス」を向上させ続けており、今のところは大幅に低い周波数でなんとかしのいでいます。 Athlon 64 ではメモリ コントローラがノースブリッジからプロセッサに移行し、火に油を注ぐことになり、RAM への前例のない高速アクセスが実現しました。 そして最近、定格 3400+ のプロセッサがリリースされました (いいえ、周波数に関して競合他社の製品に完全に準拠しているとは誰も話していません...)。
しかし、Intel と AMD は現在、ほぼ同等の状況にあります。両社のトッププロセッサは、その可能性を最大限に発揮するために、適切に最適化されたソフトウェアのリリースを待っています。 Intel はますます「マルチメディアへの移行」を進めています。Pentium 4 のパフォーマンスはオフィス ソフトウェアとしては十分以上であり、Prescott がその可能性を実現するには、最適化されたマルチメディア アプリケーション (および/または高いクロック速度、これを実現する能力が必要です) が必要です。疑い)。 SSE3 用のコーデックを再加工することは、おそらく最も難しい操作ではなく、その効果はそのようなコーデックを使用するすべてのアプリケーションにすぐに反映されるという事実は注目に値します (アプリケーション自体を再加工する必要はまったくありません)。
一方、2004 年半ばには、AMD64 プラットフォーム用の Windows の 64 ビット バージョンがリリースされ、そこで Athlon 64 の機能が発揮されることになります。もちろん、ここではアプリケーションのセットについてよくある疑問が生じます。新しい OS の場合、それなしではシステムは実質的に役に立たないままになります。 ただし、少なくとも同じコーデックが 64 ビット Athlon 用にコンパイルされてすでに存在していることに注意してください。 したがって、近い将来、AMD プラットフォームが活躍の場を得る可能性があります。 一般的に、巨人たちは筋肉を強化し、防御構造を構築し、主要な作業に備えて後方を準備しているだけであるように見えます...いいえ、むしろ、 次戦い...
導入
夏休みシーズンの前に、大手プロセッサ メーカーである AMD と Intel は、高性能 PC を対象とした最新の CPU シリーズの最新プロセッサをリリースしました。 まず、AMD は今後の質的飛躍の前に最後の一歩を踏み出し、約 1 か月前に、Athlon XP ファミリの最速の代表となると期待される Athlon XP 3200+ を発表しました。 この市場分野におけるAMDのさらなる計画は、今年9月に登場する予定のx86-64アーキテクチャの次世代プロセッサ、Athlon 64にすでに関連付けられている。 Intelは少し待って、0.13ミクロンのNorthwoodコアを搭載した最後のPenlium 4を本日のみ発表した。 その結果、このファミリーの最終モデルは周波数 3.2 GHz の Pentium 4 となりました。 新しい Prescott コアをベースにした次のデスクトップ プロセッサのリリースまでの一時停止は第 4 四半期まで続き、インテルはクロック速度の向上とアーキテクチャの改善によりデスクトップ プロセッサのパフォーマンスの基準を再び引き上げます。
Athlon アーキテクチャと Pentium 4 アーキテクチャの対立において、Intel のアーキテクチャの方がスケーラブルであることが証明されたことに注意してください。 さまざまな技術プロセスを使用して製造された Pentium 4 の存在期間を通じて、その周波数はすでに 2 倍以上になり、従来の 0.13 ミクロンの技術プロセスを使用して問題なく 3.2 GHz に到達しました。 AMD は Athlon XP の 2.2 GHz に固執していましたが、現時点では自社のプロセッサでそのような高い周波数を誇ることはできません。 また、同じ周波数では、Athlon XP は Pentium 4 よりもパフォーマンスで大幅に優れていますが、クロック周波数の差が拡大し続けているため、その代償は大きくなっています。周波数 2.2 GHz の Athlon XP 3200+ は、本格的な製品と言えます。 Penium 4 3.2 GHz の競合相手となるのは、重要な条件がある場合のみです。
以下のグラフでは、Pentium 4 および Athlon ファミリのプロセッサの周波数が過去 3 年間でどのように増加したかを示すことにしました。
ご覧のとおり、2.2 GHz の周波数は AMD にとって乗り越えられない障壁であり、克服できるのはせいぜい来年後半で、AMD が生産設備を 90 ナノメートル テクノロジの使用に移行するときだけでしょう。 それまでは、次世代の Athlon 64 プロセッサでもこのような低い周波数が続くでしょう。 彼らがプレスコットと競争できるかどうかを言うのは難しい。 しかし、AMDは深刻な問題に直面しているようだ。 Prescott は、大規模な L1 および L2 キャッシュ、改善されたハイパー スレッディング テクノロジー、および周波数の向上を備えており、Athlon 64 よりもはるかに魅力的な製品になる可能性があります。
Pentium 4 プロセッサに関しては、そのスケーラビリティが羨ましい限りです。 Pentium 4 の周波数は、これらのプロセッサのリリース以来、徐々に増加しています。 今年の夏から秋にかけて観察されたわずかな停滞は、新しい技術プロセスを導入する必要性によって説明されますが、プロセッサ市場の勢力均衡に影響を与えるものではありません。 ハイパー スレッディング テクノロジを有効にし、800 MHz バスを使用するようにプロセッサを切り替えることにより、Intel は競合他社のプロセッサに対する古い CPU モデルの顕著な優位性を達成し、少なくとも Athlon 64 が大量に配布されるまでは何も心配する必要はなくなりました。が始まります。
また、上のグラフでは、AMD と Intel が新しい CPU をリリースする当面の計画を示しました。 AMDは当面、市場における自社の地位について幻想を抱いてはいけないようだ。 Intelとの互角の戦いは終わり、同社は追いつくといういつもの役割に戻る。 ただし、長期的な予測を立てるのは時期尚早です。Athlon 64 のリリースが AMD に何をもたらすか見てみましょう。ただし、AMD64 テクノロジに対するソフトウェア開発者の反応が抑制されていることから判断すると、次のリリースで革命が起こることはありません。 AMD のプロセッサの世代。
インテル ペンティアム 4 3.2 GHz
Intel が本日 6 月 23 日に発表した新しい Pentium 4 3.2 GHz プロセッサは、技術的な観点から見ると特別なものではありません。 これは同じ Northwood で、800 MHz のバス周波数で動作し、ハイパー スレッディング テクノロジをサポートしています。 つまり、このプロセッサは、インテルが 4 月に発表した Pentium 4 3.0 と (クロック周波数を除いて) まったく同じです。
Pentium 4 3.2 GHz プロセッサは、前世代と同様に、D1 ステッピング コアを使用します。
Northwood コアをベースにした次期 Pentium 4 プロセッサのリリースに関連して注目すべき唯一の事実は、発熱が新たに増加したことです。 現在、Pentium 4 3.2 GHz の標準的な熱放散は約 85 W で、最大値は 100 W を大幅に超えています。 そのため、Pentium 4 3.2 GHz ベースのシステムを動作させる場合には、適切に設計されたケースの使用が必須要件の 1 つとなります。 ケース内の 1 つのファンでは明らかに不十分です。さらに、プロセッサーが配置されているエリアの空気が十分に換気されていることを確認する必要があります。 Intelはまた、プロセッサーのヒートシンクの周囲の空気の温度が42度を超えてはいけないとも述べている。
さて、今回紹介した Pentium 4 3.2 GHz は、0.13 ミクロン テクノロジーをベースとした、高性能デスクトップ システム用の Intel の最新 CPU であることをもう一度思い出してください。 このようなシステムの次のプロセッサには、90 ナノメートル技術を使用して製造された新しい Prescott コアが使用される予定です。 したがって、将来のデスクトッププロセッサの熱放散は少なくなるでしょう。 その結果、Pentium 4 3.2 GHz は引き続き熱放散の記録保持者となるでしょう。
Pentium 4 3.2 GHz の公式価格は 637 ドルで、このプロセッサが今日のデスクトップ コンピュータ用の CPU の中で最も高価であることを意味します。 さらに、インテルは、i875P チップセットをベースにした高価なマザーボードで新製品を使用することを推奨しています。 ただし、ご存知のとおり、この要件は無視できます。i865PE ベースの安価なマザーボードの多くは、i865PE ロジック セットでメーカーが PAT テクノロジを有効化しているため、同様のレベルのパフォーマンスを提供します。
テスト方法
このテストの目的は、新しい Pentium 4 3.2 GHz が競合する Athlon XP 製品ラインの以前のモデルや古いモデルと比較して提供できるパフォーマンス レベルを判断することでした。 したがって、Pentium 4 3.2 GHz、Petnium 4 3.0 GHz に加えて、Athlon XP 3200+、および Athlon XP 3000+ がテストに参加しました。 Pentium 4 テストのプラットフォームとして、デュアル チャネル DDR400 メモリを搭載した i875P チップセット (Canterwood) ベースのマザーボードを選択し、Athlon XP テストは、最も強力な NVIDIA nForce 400 Ultra チップセットをベースとしたマザーボードを使用して実行されました。
テスト システムの構成は次のとおりです。
ノート:
- すべての場合において、メモリはデュアルチャネル構成の FSB を使用した同期モードで動作しました。 使用された最も攻撃的なタイミングは 2-2-2-5 でした。
- テストは、DirectX 9.0a がインストールされた Windows XP SP1 オペレーティング システムで実行されました。
オフィスおよびコンテンツ作成アプリケーションの生産性
まず、確立された伝統に従って、オフィス アプリケーションとデジタル コンテンツを扱うアプリケーションのプロセッサの速度を測定しました。 これを行うために、Winstone ファミリのテスト パッケージを使用しました。
一般的なオフィス ビジネス アプリケーションを含む Business Winstone 2002 では、Athlon XP ファミリのプロセッサが最高の性能を発揮し、そのパフォーマンスは競合するファミリのプロセッサの速度を大幅に上回ります。 この状況は、このテストでは非常に一般的であり、Athlon XP アーキテクチャの機能と、L2 の排他性により総容量が 640 KB に達する Barton コアの大量のキャッシュ メモリの両方によって決定されます。
デジタル コンテンツを操作するアプリケーションのテスト プラットフォームの速度を測定する包括的なテストである Multimedia Content Creation Winstone 2003 では、状況は多少異なります。 NetBurst アーキテクチャを備えた Pentium 4 プロセッサと、毎秒 6.4 GB の帯域幅を備えた高速バスにより、古い Athlon XP モデルを大きく引き離します。
ストリーミングデータ処理時のパフォーマンス
データ ストリームを扱うほとんどのアプリケーションは、Pentium 4 プロセッサでより高速に動作することが知られています。ここで、NetBurst アーキテクチャのすべての利点が明らかになります。 したがって、WinRAR 3.2 で得られた結果は誰も驚かないはずです。 古い Pentium 4 は、情報圧縮速度の点でトップエンドの Athlon XP を大幅に上回っています。
LAME 3.93 コーデックを使用してサウンド ファイルを mp3 形式にエンコードするときにも、同様の状況が観察されます。 ちなみに、このコーデックはマルチスレッドをサポートしているため、ここでの Pentium 4 の高い結果は、これらの CPU によるハイパー スレッディング テクノロジのサポートによるものとも考えられます。 その結果、Pentium 4 3.2 は、定格 3200+ の古い Athlon XP をほぼ 20% 上回りました。
このテストには、最高のエンコーダの 1 つである Canopus Procoder 1.5 を使用して、AVI ビデオを MPEG-2 形式にエンコードする速度を測定して得られた結果が含まれています。 驚くべきことに、この場合は Athlon XP の方がわずかに高いパフォーマンスを示しています。 ただし、これはおそらく、Athlon XP に搭載されている高性能浮動小数点ユニットに起因するものと考えられます。 この場合、Pentium 4 プロセッサの SSE2 命令は、ご覧のとおり、強力な代替手段とはなり得ません。 ただし、古い Athlon XP と Pentium 4 モデル間の速度の差は非常に小さいことに注意してください。
MPEG-4 ビデオ エンコーディングは、ハイパー スレッディング テクノロジと 800 MHz バスを備えた Pentium 4 プロセッサが強みを発揮するタスクのもう 1 つの例です。 このテストでは、Athlon XP 3200+ に対する Pentium 4 3.2 の優位性はほぼ 20% です。
Windows Media Encoder 9 を使用してビデオをエンコードするときにも同様の状況が観察されます。このアプリケーションは SSE2 コマンド セット用に最適化されており、NetBurst アーキテクチャに完全に適しています。 したがって、チャートの上部が再び Intel のプロセッサーによって占められることは、まったく驚くべきことではありません。
ゲームパフォーマンス
パッチ適用バージョン 3Dmark03 のリリース後、このテストでは Athlon XP と比較して Pentium 4 の結果がわずかに高くなりました。 ただし、これによってパワーバランスが変わることはありませんでした。以前は、Pentium 4 がこのベンチマークでリーダーでした。
Pentium 4 は 3Dmark03 の総合順位でリーダーであることを確認します。 確かに、ここでの差は小さいです。これは、3Dmark03 がまずビデオ サブシステムのテストであるという事実によるものです。
Pentium 4 が 800 MHz バスの使用に切り替わった後、Pentium 4 は古いバージョンの 3Dmark2001 で Athlon XP を上回る性能を発揮し始めました。 さらに、Pentium 4 3.2 GHz と Athlon XP 3200+ との差はすでにかなり大きく、その差は 6% に達します。
Quake3 では、Pentium 4 が伝統的に Athlon XP よりも優れているため、この結果は驚くべきことではありません。
同様の状況はゲーム「Return to Castle Wolfenstein」でも見られます。 このゲームは同じ Quake3 エンジンを使用しているため、これは完全に理にかなっています。
古い Athlon XP モデルがリードを保っている数少ないアプリケーションの 1 つは、Unreal Championship 2003 です。最新のゲームはすべてハイパー スレッディング テクノロジをサポートしているわけではないため、新しい Pentium 4 の可能性はまだ完全には発揮されていないことに注意してください。ゲームで明らかになった。
しかし、Serious Sam 2 では、Athlon XP 3200+ はもはやリーダーではありません。 Intel からの新しいプロセッサのリリースにより、このゲームの主役は Pentium 4 3.2 GHz になります。
新しい Splinter Cell ゲームは、Unreal Championship 2003 と同じエンジンをベースとしていますが、Intel プロセッサでより高速に実行されます。
一般に、現時点で最新の 3D ゲーム用の最速プロセッサは Pentium 4 3.2 GHz であり、ほとんどのゲーム テストで Athlon XP 3200+ を上回っていることは認められません。 状況は急速に変化しています。 つい最近、ゲーム テストでは、古い Athlon XP が Intel プロセッサにまったく劣りませんでした。
3Dレンダリング性能
このテストで使用した 3ds max 5.1 はマルチスレッド向けに十分に最適化されているため、ハイパー スレッディング テクノロジのおかげで 2 つのスレッドを同時に実行できる Pentium 4 が大差でリーダーとなっています。 古い Athlon XP 3200+ でさえ、それに匹敵することはできません。
Lightwave 7.5 のレンダリング速度についてもまったく同じことが言えます。 ただし、Sunset をレンダリングする場合など、一部のシーンでは、古い Athlon XP モデルでもそれほど悪くないように見えますが、そのようなケースはまれです。
Athlon XP のレンダリング タスクでは、2 つのスレッドを同時に実行する Pentium 4 と競合するのは困難です。 残念ながら、AMD には将来の Athlon 64 プロセッサにもハイパー スレッディングのようなテクノロジを導入する予定はありません。
まったく同様の状況が POV-Ray 3.5 でも観察されます。
科学的パフォーマンス
科学計算で AMD の新しい CPU の速度をテストするために、ScienceMark 2.0 パッケージが使用されました。 このテストの詳細については、http://www.sciencemark.org をご覧ください。 このベンチマークは、マルチスレッドだけでなく、MMX、3DNow!、SSE、SSE2 を含むすべての SIMD 命令セットをサポートしています。
Athlon XP ファミリ プロセッサが数学的モデリングまたは暗号化タスクで最高のパフォーマンスを発揮することは長い間知られていました。 ここで、この事実の別の確認が見られます。 ただし、Athlon XP は以前の利点を失い始めていると言わざるを得ません。 たとえば、分子動力学テストでは、新しい Pentium 4 3.2 GHz がトップになりました。
このセクションの ScienceMark テストに加えて、オリゴペプチド (タンパク質断片) の動的特性の計算に特化したロシアの分散コンピューティング プロジェクト MD@home のクライアントで新しいプロセッサの速度をテストすることにしました。 オリゴペプチドの性質を計算することは、タンパク質の基本的な性質の研究に役立ち、それによって科学の発展に貢献できる可能性があります。
ご覧のとおり、新しい Pentium 4 は、Athlon XP よりも速く分子動力学の問題を解決します。 Pentium 4 は、ハイパー スレッディング テクノロジのおかげでこのような高い結果を達成します。 残念ながら、MD@home クライアント自体はマルチスレッドをサポートしていませんが、ハイパー スレッディング テクノロジを備えたプロセッサを搭載したシステムで 2 つのクライアント プログラムを並行して実行すると、計算プロセスを 40% 以上高速化できます。
結論
このテストは、競争の次の段階で Intel が AMD を破ることに成功したことを明確に示しています。 Northwood コアをベースにした最新のプロセッサは、ほとんどのテストで旧モデルおよび最新の Athlon XP モデルよりも優れたパフォーマンスを示します。 最近、Intel は CPU の周波数を大幅に上げ、バスの周波数を上げ、また、多くのタスクの速度をさらに向上させる賢いハイパー スレッディング テクノロジを導入することができました。 AMDは、技術的およびアーキテクチャ上の困難によりプロセッサのクロック速度を上げることができず、CPUを適切に強化することができませんでした。 新しい Barton コアが登場しても状況は改善されませんでした。最新の Pentium 4 モデルは古い Athlon XP よりも明らかに強力です。 その結果、Pentium 4 3.2 GHz は、現時点でデスクトップ システム用の最も強力な CPU であると考えられます。 この状況は、少なくともAMDが最終的に新しいAthlon 64ファミリープロセッサを発表しなければならない9月まで続くだろう。
また、AMD がプロセッサのラベル付けに現在使用している評価システムは、Athlon XP と Pentium 4 を比較するための基準ではなくなりました。これらの CPU の変換を含め、Pentium 4 で行われた改善点にも注意してください。 800 MHz バス上での動作とハイパー スレッディング テクノロジの導入により、対応する Athlon XP の定格と同じ周波数を持つ Pentium 4 のほうが明らかに高速になっています。
一般的に、AMD と Intel の両社が新開発の Prescott と Athlon 64 を発表する秋を楽しみにしています。これにより、プロセッサ市場における長年のライバル間の競争が激化する可能性があります。 現在、AMD は Intel に押しのけられて、低コスト プロセッサの分野に参入していますが、この会社は優れていると感じています。Celeron は、Athlon XP と比較すると、率直に言って弱い競争相手です。
家族 Pentium 4プロセッサ Intel が製造した PC は、誇張することなく、デスクトップ コンピュータの世界で長年にわたって最も人気があります。 コンピューターにあまり詳しくない人々の口の中の「Pentium」という言葉でさえ、コンピューターの速度とパワーを意味していました。 利点の中には ペンティアム4- 低価格、高性能、比較的低い消費電力 (プロセッサの動作クロック周波数に応じて)。 Pentium 4 がソケットにインストールされている ソケット 478 または LGA755
Pentium 4 プロセッサは Intel NetBurst マイクロアーキテクチャに基づいており、ハイパースレッディング テクノロジ (これについては後で説明します)、周波数 400/533/800 MHz の FSB、SSE2 ストリーミング命令などの多くの機能をサポートします。 、高度な動的実行機能と最適化されたキャッシュ データ転送。 さらに、0.09 ミクロン テクノロジーを使用して構築された Pentium 4 プロセッサは、SSE3 ストリーミング命令をサポートします。
SSE、SSE2、および SSE3 命令は MMX テクノロジの拡張であり、グラフィックスとサウンド、浮動小数点と整数の計算、キャッシュ メモリ管理を操作するための多数のコマンドが含まれています。 これらの手順により、3D グラフィックス、ストリーミング オーディオおよびビデオ データ (DVD 再生時など) をより効率的に操作し、MPEG2 および MPEG3 (MP3) ファイルをデコードできるようになります。 ただし、SSE サポートがアプリケーション レベルで実装されている場合、SSE の使用から最良の結果が得られます。
現在、市場にはさまざまな Pentium 4 プロセッサがあり、種類が多いため混乱しがちです。 大きく分けて2つの家族がいます Pentium 4 - 5xx および 6xxここで、x はプロセッサのタイプ番号です。
5xx ファミリには、HT テクノロジーと 1 MB L2 キャッシュをサポートするプロセッサ 570、560、550、540、530、および 520 が含まれています。 一方、6xx ファミリにはプロセッサ 672、662、660、650、640 が含まれており、これらも HT テクノロジをサポートし、2 MB L2 キャッシュ メモリを備えているほか、Intel Enhanced SpeedStep、EM64T、および Execute Disable Bit ( NX) テクノロジービット)。
インテル Pentium 4 テクノロジー
強化された SpeedStep テクノロジー作業アプリケーションのプロセッサのクロック速度を自動的に下げることで、システムの消費電力を削減できます。 このテクノロジーのおかげで、現代のデスクトップ コンピューターの省エネと冷却の問題は解決されます。 Intel Enhanced SpeedStep テクノロジは、Pentium 4 bxx および Pentium D プロセッサ ファミリでサポートされています。
すべての Pentium 4 プロセッサは 32 ビットです。 ただし、ありがとう EM64Tテクノロジー、新しい Pentium 4 bxx プロセッサ ファミリで利用可能なこれらのプロセッサは、64 ビット アプリケーションのサポートを備えています。 32 ビット アプリケーションと 64 ビット アプリケーションの違いについては、「Athlon 64」セクションで説明します。 主な利点 EM64Tテクノロジー- これは、コンピュータに RAM をインストールする機能で、その合計量は 4 GB を超えます (4 GB が 32 ビット オペレーティング システムでアドレス指定できる RAM の最大量であるため)。
ディセーブル ビット テクノロジ (NX-bit) の実行データを保存するためのメモリ領域にあるプログラム コードの実行を禁止できます。 通常のウイルスやトロイの木馬などの多くのウイルスは、バッファ オーバーフローとして知られるソフトウェア エラーを引き起こし、破壊的なプログラム コードをオペレーティング システムが使用できるデータとして偽装する可能性があります。 このようなシナリオを防ぐには、次のことが必要です NXビットこれにより、システムの保護が強化され、ウイルスの侵入が成功する可能性が低くなります。 同様のテクノロジーが Athlon 64 にも存在します。 それは強化されたウイルス保護と呼ばれます。
以下の表には、主要な Pentium 4 プロセッサの特性が含まれていることに注意してください。 一部の Pentium 4 モデルのみが示されています。利用可能なすべてのモデルの詳細なリストについては、Intel Web サイト (www.intel.ru) を参照してください。
テーブル。 Pentium 4プロセッサ
|
ご覧のとおり、最も生産性の高いプロセッサは Pentium 4 6xx ファミリで、2 MB の L2 キャッシュ メモリとユニバーサル テクノロジ サポートを備えています。 ハイパースレッディング、強化された SpeedStep、EM64T および NX ビット。 また、同じクロック速度の Socket 478 プロセッサでも、FSB クロック速度と L2 キャッシュ サイズが異なることに注意してください。
導入
夏休みシーズンの前に、大手プロセッサ メーカーである AMD と Intel は、高性能 PC を対象とした最新の CPU シリーズの最新プロセッサをリリースしました。 まず、AMD は今後の質的飛躍の前に最後の一歩を踏み出し、約 1 か月前に、Athlon XP ファミリの最速の代表となると期待される Athlon XP 3200+ を発表しました。 この市場分野におけるAMDのさらなる計画は、今年9月に登場する予定のx86-64アーキテクチャの次世代プロセッサ、Athlon 64にすでに関連付けられている。 Intelは少し待って、0.13ミクロンのNorthwoodコアを搭載した最後のPenlium 4を本日のみ発表した。 その結果、このファミリーの最終モデルは周波数 3.2 GHz の Pentium 4 となりました。 新しい Prescott コアをベースにした次のデスクトップ プロセッサのリリースまでの一時停止は第 4 四半期まで続き、インテルはクロック速度の向上とアーキテクチャの改善によりデスクトップ プロセッサのパフォーマンスの基準を再び引き上げます。
Athlon アーキテクチャと Pentium 4 アーキテクチャの対立において、Intel のアーキテクチャの方がスケーラブルであることが証明されたことに注意してください。 さまざまな技術プロセスを使用して製造された Pentium 4 の存在期間を通じて、その周波数はすでに 2 倍以上になり、従来の 0.13 ミクロンの技術プロセスを使用して問題なく 3.2 GHz に到達しました。 AMD は Athlon XP の 2.2 GHz に固執していましたが、現時点では自社のプロセッサでそのような高い周波数を誇ることはできません。 また、同じ周波数では、Athlon XP は Pentium 4 よりもパフォーマンスで大幅に優れていますが、クロック周波数の差が拡大し続けているため、その代償は大きくなっています。周波数 2.2 GHz の Athlon XP 3200+ は、本格的な製品と言えます。 Penium 4 3.2 GHz の競合相手となるのは、重要な条件がある場合のみです。
以下のグラフでは、Pentium 4 および Athlon ファミリのプロセッサの周波数が過去 3 年間でどのように増加したかを示すことにしました。
ご覧のとおり、2.2 GHz の周波数は AMD にとって乗り越えられない障壁であり、克服できるのはせいぜい来年後半で、AMD が生産設備を 90 ナノメートル テクノロジの使用に移行するときだけでしょう。 それまでは、次世代の Athlon 64 プロセッサでもこのような低い周波数が続くでしょう。 彼らがプレスコットと競争できるかどうかを言うのは難しい。 しかし、AMDは深刻な問題に直面しているようだ。 Prescott は、大規模な L1 および L2 キャッシュ、改善されたハイパー スレッディング テクノロジー、および周波数の向上を備えており、Athlon 64 よりもはるかに魅力的な製品になる可能性があります。
Pentium 4 プロセッサに関しては、そのスケーラビリティが羨ましい限りです。 Pentium 4 の周波数は、これらのプロセッサのリリース以来、徐々に増加しています。 今年の夏から秋にかけて観察されたわずかな停滞は、新しい技術プロセスを導入する必要性によって説明されますが、プロセッサ市場の勢力均衡に影響を与えるものではありません。 ハイパー スレッディング テクノロジを有効にし、800 MHz バスを使用するようにプロセッサを切り替えることにより、Intel は競合他社のプロセッサに対する古い CPU モデルの顕著な優位性を達成し、少なくとも Athlon 64 が大量に配布されるまでは何も心配する必要はなくなりました。が始まります。
また、上のグラフでは、AMD と Intel が新しい CPU をリリースする当面の計画を示しました。 AMDは当面、市場における自社の地位について幻想を抱いてはいけないようだ。 Intelとの互角の戦いは終わり、同社は追いつくといういつもの役割に戻る。 ただし、長期的な予測を立てるのは時期尚早です。Athlon 64 のリリースが AMD に何をもたらすか見てみましょう。ただし、AMD64 テクノロジに対するソフトウェア開発者の反応が抑制されていることから判断すると、次のリリースで革命が起こることはありません。 AMD のプロセッサの世代。
インテル ペンティアム 4 3.2 GHz
Intel が本日 6 月 23 日に発表した新しい Pentium 4 3.2 GHz プロセッサは、技術的な観点から見ると特別なものではありません。 これは同じ Northwood で、800 MHz のバス周波数で動作し、ハイパー スレッディング テクノロジをサポートしています。 つまり、このプロセッサは、インテルが 4 月に発表した Pentium 4 3.0 と (クロック周波数を除いて) まったく同じです。
Pentium 4 3.2 GHz プロセッサは、前世代と同様に、D1 ステッピング コアを使用します。
Northwood コアをベースにした次期 Pentium 4 プロセッサのリリースに関連して注目すべき唯一の事実は、発熱が新たに増加したことです。 現在、Pentium 4 3.2 GHz の標準的な熱放散は約 85 W で、最大値は 100 W を大幅に超えています。 そのため、Pentium 4 3.2 GHz ベースのシステムを動作させる場合には、適切に設計されたケースの使用が必須要件の 1 つとなります。 ケース内の 1 つのファンでは明らかに不十分です。さらに、プロセッサーが配置されているエリアの空気が十分に換気されていることを確認する必要があります。 Intelはまた、プロセッサーのヒートシンクの周囲の空気の温度が42度を超えてはいけないとも述べている。
さて、今回紹介した Pentium 4 3.2 GHz は、0.13 ミクロン テクノロジーをベースとした、高性能デスクトップ システム用の Intel の最新 CPU であることをもう一度思い出してください。 このようなシステムの次のプロセッサには、90 ナノメートル技術を使用して製造された新しい Prescott コアが使用される予定です。 したがって、将来のデスクトッププロセッサの熱放散は少なくなるでしょう。 その結果、Pentium 4 3.2 GHz は引き続き熱放散の記録保持者となるでしょう。
Pentium 4 3.2 GHz の公式価格は 637 ドルで、このプロセッサが今日のデスクトップ コンピュータ用の CPU の中で最も高価であることを意味します。 さらに、インテルは、i875P チップセットをベースにした高価なマザーボードで新製品を使用することを推奨しています。 ただし、ご存知のとおり、この要件は無視できます。i865PE ベースの安価なマザーボードの多くは、i865PE ロジック セットでメーカーが PAT テクノロジを有効化しているため、同様のレベルのパフォーマンスを提供します。
テスト方法
このテストの目的は、新しい Pentium 4 3.2 GHz が競合する Athlon XP 製品ラインの以前のモデルや古いモデルと比較して提供できるパフォーマンス レベルを判断することでした。 したがって、Pentium 4 3.2 GHz、Petnium 4 3.0 GHz に加えて、Athlon XP 3200+、および Athlon XP 3000+ がテストに参加しました。 Pentium 4 テストのプラットフォームとして、デュアル チャネル DDR400 メモリを搭載した i875P チップセット (Canterwood) ベースのマザーボードを選択し、Athlon XP テストは、最も強力な NVIDIA nForce 400 Ultra チップセットをベースとしたマザーボードを使用して実行されました。
テスト システムの構成は次のとおりです。
ノート:
- すべての場合において、メモリはデュアルチャネル構成の FSB を使用した同期モードで動作しました。 使用された最も攻撃的なタイミングは 2-2-2-5 でした。
- テストは、DirectX 9.0a がインストールされた Windows XP SP1 オペレーティング システムで実行されました。
オフィスおよびコンテンツ作成アプリケーションの生産性
まず、確立された伝統に従って、オフィス アプリケーションとデジタル コンテンツを扱うアプリケーションのプロセッサの速度を測定しました。 これを行うために、Winstone ファミリのテスト パッケージを使用しました。
一般的なオフィス ビジネス アプリケーションを含む Business Winstone 2002 では、Athlon XP ファミリのプロセッサが最高の性能を発揮し、そのパフォーマンスは競合するファミリのプロセッサの速度を大幅に上回ります。 この状況は、このテストでは非常に一般的であり、Athlon XP アーキテクチャの機能と、L2 の排他性により総容量が 640 KB に達する Barton コアの大量のキャッシュ メモリの両方によって決定されます。
デジタル コンテンツを操作するアプリケーションのテスト プラットフォームの速度を測定する包括的なテストである Multimedia Content Creation Winstone 2003 では、状況は多少異なります。 NetBurst アーキテクチャを備えた Pentium 4 プロセッサと、毎秒 6.4 GB の帯域幅を備えた高速バスにより、古い Athlon XP モデルを大きく引き離します。
ストリーミングデータ処理時のパフォーマンス
データ ストリームを扱うほとんどのアプリケーションは、Pentium 4 プロセッサでより高速に動作することが知られています。ここで、NetBurst アーキテクチャのすべての利点が明らかになります。 したがって、WinRAR 3.2 で得られた結果は誰も驚かないはずです。 古い Pentium 4 は、情報圧縮速度の点でトップエンドの Athlon XP を大幅に上回っています。
LAME 3.93 コーデックを使用してサウンド ファイルを mp3 形式にエンコードするときにも、同様の状況が観察されます。 ちなみに、このコーデックはマルチスレッドをサポートしているため、ここでの Pentium 4 の高い結果は、これらの CPU によるハイパー スレッディング テクノロジのサポートによるものとも考えられます。 その結果、Pentium 4 3.2 は、定格 3200+ の古い Athlon XP をほぼ 20% 上回りました。
このテストには、最高のエンコーダの 1 つである Canopus Procoder 1.5 を使用して、AVI ビデオを MPEG-2 形式にエンコードする速度を測定して得られた結果が含まれています。 驚くべきことに、この場合は Athlon XP の方がわずかに高いパフォーマンスを示しています。 ただし、これはおそらく、Athlon XP に搭載されている高性能浮動小数点ユニットに起因するものと考えられます。 この場合、Pentium 4 プロセッサの SSE2 命令は、ご覧のとおり、強力な代替手段とはなり得ません。 ただし、古い Athlon XP と Pentium 4 モデル間の速度の差は非常に小さいことに注意してください。
MPEG-4 ビデオ エンコーディングは、ハイパー スレッディング テクノロジと 800 MHz バスを備えた Pentium 4 プロセッサが強みを発揮するタスクのもう 1 つの例です。 このテストでは、Athlon XP 3200+ に対する Pentium 4 3.2 の優位性はほぼ 20% です。
Windows Media Encoder 9 を使用してビデオをエンコードするときにも同様の状況が観察されます。このアプリケーションは SSE2 コマンド セット用に最適化されており、NetBurst アーキテクチャに完全に適しています。 したがって、チャートの上部が再び Intel のプロセッサーによって占められることは、まったく驚くべきことではありません。
ゲームパフォーマンス
パッチ適用バージョン 3Dmark03 のリリース後、このテストでは Athlon XP と比較して Pentium 4 の結果がわずかに高くなりました。 ただし、これによってパワーバランスが変わることはありませんでした。以前は、Pentium 4 がこのベンチマークでリーダーでした。
Pentium 4 は 3Dmark03 の総合順位でリーダーであることを確認します。 確かに、ここでの差は小さいです。これは、3Dmark03 がまずビデオ サブシステムのテストであるという事実によるものです。
Pentium 4 が 800 MHz バスの使用に切り替わった後、Pentium 4 は古いバージョンの 3Dmark2001 で Athlon XP を上回る性能を発揮し始めました。 さらに、Pentium 4 3.2 GHz と Athlon XP 3200+ との差はすでにかなり大きく、その差は 6% に達します。
Quake3 では、Pentium 4 が伝統的に Athlon XP よりも優れているため、この結果は驚くべきことではありません。
同様の状況はゲーム「Return to Castle Wolfenstein」でも見られます。 このゲームは同じ Quake3 エンジンを使用しているため、これは完全に理にかなっています。
古い Athlon XP モデルがリードを保っている数少ないアプリケーションの 1 つは、Unreal Championship 2003 です。最新のゲームはすべてハイパー スレッディング テクノロジをサポートしているわけではないため、新しい Pentium 4 の可能性はまだ完全には発揮されていないことに注意してください。ゲームで明らかになった。
しかし、Serious Sam 2 では、Athlon XP 3200+ はもはやリーダーではありません。 Intel からの新しいプロセッサのリリースにより、このゲームの主役は Pentium 4 3.2 GHz になります。
新しい Splinter Cell ゲームは、Unreal Championship 2003 と同じエンジンをベースとしていますが、Intel プロセッサでより高速に実行されます。
一般に、現時点で最新の 3D ゲーム用の最速プロセッサは Pentium 4 3.2 GHz であり、ほとんどのゲーム テストで Athlon XP 3200+ を上回っていることは認められません。 状況は急速に変化しています。 つい最近、ゲーム テストでは、古い Athlon XP が Intel プロセッサにまったく劣りませんでした。
3Dレンダリング性能
このテストで使用した 3ds max 5.1 はマルチスレッド向けに十分に最適化されているため、ハイパー スレッディング テクノロジのおかげで 2 つのスレッドを同時に実行できる Pentium 4 が大差でリーダーとなっています。 古い Athlon XP 3200+ でさえ、それに匹敵することはできません。
Lightwave 7.5 のレンダリング速度についてもまったく同じことが言えます。 ただし、Sunset をレンダリングする場合など、一部のシーンでは、古い Athlon XP モデルでもそれほど悪くないように見えますが、そのようなケースはまれです。
Athlon XP のレンダリング タスクでは、2 つのスレッドを同時に実行する Pentium 4 と競合するのは困難です。 残念ながら、AMD には将来の Athlon 64 プロセッサにもハイパー スレッディングのようなテクノロジを導入する予定はありません。
まったく同様の状況が POV-Ray 3.5 でも観察されます。
科学的パフォーマンス
科学計算で AMD の新しい CPU の速度をテストするために、ScienceMark 2.0 パッケージが使用されました。 このテストの詳細については、http://www.sciencemark.org をご覧ください。 このベンチマークは、マルチスレッドだけでなく、MMX、3DNow!、SSE、SSE2 を含むすべての SIMD 命令セットをサポートしています。
Athlon XP ファミリ プロセッサが数学的モデリングまたは暗号化タスクで最高のパフォーマンスを発揮することは長い間知られていました。 ここで、この事実の別の確認が見られます。 ただし、Athlon XP は以前の利点を失い始めていると言わざるを得ません。 たとえば、分子動力学テストでは、新しい Pentium 4 3.2 GHz がトップになりました。
このセクションの ScienceMark テストに加えて、オリゴペプチド (タンパク質断片) の動的特性の計算に特化したロシアの分散コンピューティング プロジェクト MD@home のクライアントで新しいプロセッサの速度をテストすることにしました。 オリゴペプチドの性質を計算することは、タンパク質の基本的な性質の研究に役立ち、それによって科学の発展に貢献できる可能性があります。
ご覧のとおり、新しい Pentium 4 は、Athlon XP よりも速く分子動力学の問題を解決します。 Pentium 4 は、ハイパー スレッディング テクノロジのおかげでこのような高い結果を達成します。 残念ながら、MD@home クライアント自体はマルチスレッドをサポートしていませんが、ハイパー スレッディング テクノロジを備えたプロセッサを搭載したシステムで 2 つのクライアント プログラムを並行して実行すると、計算プロセスを 40% 以上高速化できます。
結論
このテストは、競争の次の段階で Intel が AMD を破ることに成功したことを明確に示しています。 Northwood コアをベースにした最新のプロセッサは、ほとんどのテストで旧モデルおよび最新の Athlon XP モデルよりも優れたパフォーマンスを示します。 最近、Intel は CPU の周波数を大幅に上げ、バスの周波数を上げ、また、多くのタスクの速度をさらに向上させる賢いハイパー スレッディング テクノロジを導入することができました。 AMDは、技術的およびアーキテクチャ上の困難によりプロセッサのクロック速度を上げることができず、CPUを適切に強化することができませんでした。 新しい Barton コアが登場しても状況は改善されませんでした。最新の Pentium 4 モデルは古い Athlon XP よりも明らかに強力です。 その結果、Pentium 4 3.2 GHz は、現時点でデスクトップ システム用の最も強力な CPU であると考えられます。 この状況は、少なくともAMDが最終的に新しいAthlon 64ファミリープロセッサを発表しなければならない9月まで続くだろう。
また、AMD がプロセッサのラベル付けに現在使用している評価システムは、Athlon XP と Pentium 4 を比較するための基準ではなくなりました。これらの CPU の変換を含め、Pentium 4 で行われた改善点にも注意してください。 800 MHz バス上での動作とハイパー スレッディング テクノロジの導入により、対応する Athlon XP の定格と同じ周波数を持つ Pentium 4 のほうが明らかに高速になっています。
一般的に、AMD と Intel の両社が新開発の Prescott と Athlon 64 を発表する秋を楽しみにしています。これにより、プロセッサ市場における長年のライバル間の競争が激化する可能性があります。 現在、AMD は Intel に押しのけられて、低コスト プロセッサの分野に参入していますが、この会社は優れていると感じています。Celeron は、Athlon XP と比較すると、率直に言って弱い競争相手です。