Hardware ausnutzen

Vierfach schnell dank Quad-Core - oder nicht?

01.07.2013 von Thorsten Eggeling
Was viele nicht wissen: Kaum ein Programm nutzt Mehrkern-Prozessoren wirklich. Wir zeigen Ihnen, mit welchen Tools Sie Ihre Hardware optimal nutzen können.

Wie schnell ein Programm seine Arbeit erledigt, hängt zu einem großen Teil von der Leistungsfähigkeit des PCs ab. Aktuelle Prozessoren besitzen mehrere Recheneinheiten (Mehrkern-Prozessor, Multicore) und können daher mehrere Aufgaben parallel erledigen. Aber nicht alle Programme nutzen diese Fähigkeit auch aus. Wir stellen einige kostenlose Multicore-Programme vor und geben Tipps zur optimalen Nutzung von mehreren Prozessorkernen.

Multicore-Nutzung erkennen

Prozessoren mit mehreren Kernen (Multicore) gehören inzwischen zur Standardausstattung von Desktop-PCs und Notebooks. Viele Programme nutzen die verfügbare Technik aber nicht aus und lassen daher das Potenzial moderner Prozessoren brachliegen.

Ein Multithreading-Programm nutzt alle verfügbaren Kerne des Prozessors. Im abgebildeten Beispiel liegt die CPU-Auslastung bei 100 Prozent und es werden acht Kerne verwendet.

Wie sich ein Programm verhält, erfahren Sie am einfachsten über den Windows Task-Manager. Starten Sie das Programm, das Sie untersuchen wollen, und lassen Sie es eine längere Aufgabe erledigen. Rufen Sie dann den Task-Manager über die Tastenkombination Strg-Shift-Esc auf und gehen Sie auf die Registerkarte „Leistung“. Unter „Verlauf der CPU-Auslastung“ sehen Sie jeweils ein Feld für jeden Prozessorkern. Wenn hier bei intensiver Belastung nur eine Kurve deutlich ansteigt, bearbeitet die Software die Aufgabe in nur einem Thread (single threaded). Das Gleiche gilt auch dann, wenn beispielsweise bei einem Dualcore-Prozessor beide Kurven 50 Prozent nicht überschreiten. Steigen dagegen alle Kurven gleichmäßig – bei Dualcore etwa auf 70 bis 100 Prozent – nutzt die Software alle Kerne optimal aus (multi threaded).

Schneller packen mit 7-Zip

Dateien zu komprimieren, ist ein rechenintensiver Vorgang. Packprogramme können deshalb gut von Prozessoren mit mehreren Kernen profitieren. Das kostenlose 7-Zip beherrscht Multi-Threading. Sie müssen die Option nur aktivieren.

Im Dialog „Zu Archiv hinzufügen“ stellen Sie hinter „Anzahl CPU-Threads“ einen Wert ein, der der Anzahl der Prozessorkerne entspricht. Beim 7z-Archivformat liegt das Maximum allerdings nur bei „2“. Wenn Sie Zip-Archive erstellen, können Sie maximal „16“ einstellen. Die Beschleunigung beispielsweise bei zwei im Vergleich zu acht Threads kann etwa beim Faktor drei liegen.

Wenn in Ihrem Rechner nur eine Festplatte steckt, werden Sie feststellen, dass die von 7-Zip angezeigte Transfergeschwindigkeit in der Regel deutlich unter der maximalen Transferrate der Festplatte liegt. Bei vielen Dateien, etwa bei einem Backup, sinkt die Transferrate während der Laufzeit immer weiter. Am Anfang zeigt der Festplatten-Cache noch seine Wirkung, dann aber machen sich die vielen Schreib- und Lesezugriffe bemerkbar. Sollte sich eine zweite Festplatte im Computer befinden, wählen Sie besser die se als Ziellaufwerk aus. Dann muss 7-Zip von einer Platte nur lesen und auf die andere nur schreiben. Das geht deutlich schneller.

Filme schneller umwandeln

Multicore-Prozessoren sind bei der Videobearbeitung fast schon ein Muss. Die CPU kommt allerdings bei den Berechnungen schnell an ihre Grenzen. In diesem Fall lässt sich der Prozessor der Grafikkarte (GPU) hinzuschalten und damit mehr Leistung herausholen.

Videos lassen sich mit Freemake Video Converter schneller umwandeln, weil das Programm nicht nur Multithreading, sondern auch die Prozessoren der Grafikkarte nutzt.

Viele Videokonverter nutzen Multithreading – zumindest bei der Umwandlung in das H.264-Format –, aber nicht alle können auch die GPU zu Hilfe nehmen. Der kostenlose Freemake Video Converter kann CUDA und DXVA nutzen. CUDA wird von Nvidia-Grafikkarten unterstützt und DXVA funktioniert auch mit Grafikkarten von ATI oder Intel. Freemake Video Converter verwendet diese Techniken, soweit vorhanden, automatisch, wenn Sie unter „Datei ➞ Optionen – Beschleunigung“ ein Häkchen vor „Optimale Umwandlungsparameter automatisch erkennen (Geschw. max.)“ setzen. CUDA kommt lediglich bei der Umwandlung in das H.264-Format zum Einsatz, DXVA bei H.264 und MPEG2.

Die Bedienung des Programms ist einfach. Ziehen Sie eine Videodatei vom Windows-Explorer auf das Fenster von Freemake Video Converter. Wählen Sie in der unteren Leiste das Zielformat aus und anschließend ein Umwandlungsprofil. Nach einem Klick auf „Konvertieren“ beginnt das Programm dann mit seiner Arbeit.

Audiodateien umwandeln oder CDs rippen

Mit Hilfe von Cdex können Sie Musik-CDs kopieren und Audiodateien umwandeln. Bei MP3s kommt der Open-Source-Encoder Lame zum Einsatz. Dieser verarbeitet Dateien aber nur in einem Thread und daher entsprechend langsam.

Eine aktuelle Multithreaded- und 64-Bit-Variante von Lame 3.98.2 ist fpMP3Enc. Entpacken Sie das Programm in ein beliebiges Verzeichnis auf der Festplatte. Sie sehen dann darin mehrere EXE-Dateien. „fpMP3.exe“ funktioniert mit sämtlichen Prozessoren. „fpMP3_SSE4.exe“ erhält Optimierungen für den SSE4-Befehlssatz. Hier kommt es auf einen Versuch an, ob sich damit auch ein spürbarer Geschwindigkeitsvorteil ergibt.

Um „fpMP3Enc“ in Cdex einzubinden, gehen Sie auf „Options ➞ Settings“ und dann auf „Encoding ➞ Encoders“. Wählen Sie hinter „Encoder“ den Eintrag „External Encoder“. Geben Sie unter „Encoder path“ den Pfad zu „fpMP3.exe“ an. Unter „Parameter string“ geben Sie -V 0 --vbr-new --threads [n] -f %1 %2 ein. Für die Angabe hinter „--threads“ geben Sie für [n] die Anzahl der verfügbaren Prozessorkerne ein, beispielsweise 8. Klicken Sie auf „OK“ und wandeln Sie eine Audio-CD um oder konvertieren Sie WAV-Dateien in das MP3-Format. Wie unter Punkt 1 beschrieben sehen Sie dabei im Windows Task-Manager die annähernd volle Auslastung aller Kerne. Bei acht kann sich im Vergleich zu einem Thread eine Beschleunigung um den Faktor drei ergeben.

Anwender von Windows 7 32 Bit haben die Möglichkeit, Lame-mt zu verwenden. Das Programm basiert auf Lame 3.97 und liefert unter Umständen keine optimale MP3-Qualität. Hier verwenden Sie in Cdex die Parameterzeile -V0 -vbr-new %1 %2.

Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation PC-Welt.