Skip to end of metadata
Go to start of metadata

Zusammenfassung

Das Universitätsrechenzentrum bietet Ihnen die Möglichkeit für rechenintensive Aufgaben die Ressourcen des neuen HPC-Clusters Draco zu nutzen. Dieser Cluster steht allen Forschenden und Studierenden für wissenschaftliche Projekte zur Verfügung und ergänzt den Forschungscluster Ara, der nur einem eingeschränkten Nutzerkreis zur Verfügung steht. Das Basissystem des neuen HPC-Clusters wurde im Juni 2021 Betrieb genommen und wird akuell weiter ausgebaut. Nutzer/innen sind eingeladen, die neue Hardware zu testen und Installationswünsche für weitere Softwarepakete zu äußern. Für den Zugriff reicht derzeit ihre persönliche URZ-ID.

Diese Anleitung richtet sich besonders an folgende Zielgruppen:

  • Wissenschaftliche Mitarbeitende
  • Studierende


Überblick

Das initiale Basissystem ging im Juni 2021 online und besteht aus folgenden Komponenten

  • 8 Standardrechenknoten
    • 48 CPU-Kernen (2x Intel Xeon 6248R 24 Core 3,0 GHz)
    • 384 GB Arbeitsspeicher
  • 1 Visualisierungsknoten ("Remote Workstation" über NiceDCV)
    • 40 CPU-Kernen (2x Intel Xeon 6240R 20 Core 3,1 GHz)
    • 768 GB Arbeitsspeicher
    • 1 NVIDIA Quadro RTX 5000
    • 3.2 TB NVMe lokalem Scratchspeicher
  • 4 Hybrid CPU-GPU Knoten
    • 128 CPU Kernen (2x AMD Epyc 7702 64 Core 2,0 GHz)
    • 1 TB Arbeitsspeicher
    • 2 NVIDIA Tesla V100 GPUs 32 GB RAM
  • 1 NVIDIA 4-GPU-Knoten
    • 128 CPU-Kernen (2x AMD EPYC 7662 64 Core 2,0 GHz)
    • 512 GB Arbeitsspeicher
    • NVIDIA HGX A100 4-GPU 40GB SXM4 GPUs
    • 6.4 TB lokaler Scratchspeicher
  • BeeGFS-Dateisystem mit einer Speicherkapazität von ca. 66 TB für die Nutzerverzeichnisse (/home)
  • Infiniband Interconnect (EDR 100Gb/s)

Zugriff

Nutzer/innen können derzeit per SSH-Verbindung zum Loginknoten auf den HPC-Cluster zugreifen. Für den Login reicht ihre persönliche URZ-ID.

Login unter Linux / macOS
ssh <urzid>@login1.draco.uni-jena.de

Unter Windows lassen sich SSH-Verbindungen mit dem Programm Putty realisieren.

Nutzung via Slurm

Für die Nutzung der verschiedenen Rechenknoten muss das Workload-Managementsystem Slurm verwendet werden. Slurm erlaubt die Absendung von Rechenjobs (sogenannte "batch jobs") als auch die Nutzung einzelner Rechenknoten für interaktive Aufgaben. Je nach Auslastung des Systems können sich Wartezeiten ergeben.

Achtung: Eine intensive Nutzung des Loginknoten, z.B. für Rechenaufgaben, ist nicht gestattet.

Initial müssen die Nutzer/innen ihre URZ-ID per E-Mail oder Ticket an die Systemadministratoren senden. Entsprechende Kontakdaten werden ihnen beim ersten Login angezeigt.

Weitere Informationen zur Nutzung des Workload-Managementsystem Slurm folgen auf den Unterseiten. Die dort aufgeführten Beispiele dürfen gern für die eigenen Bedürfnisse angepasst werden. Für weitere Fragen zur Nutzung und Auslastung des System können sie sich gern an uns werden.

Ansprechpartner

Dr. Andre Sternbeck, HPC-Fachberater, URZ


Die aktuellen Komponenten des neuen HPC-Basissystem Draco. Die Racks enthalten Dateiserver, Rechen- und GPU-Knoten



Titel: "HPC-Cluster Draco für Lehre und Forschung"

Stand: 07.04.2020