Diese Masterarbeit konzentriert sich auf die Optimierung der Inferenzphase von Graphenverarbeitungsmodellen und geht dabei auf die besonderen Herausforderungen ein, die durch graphenstrukturierte Daten entstehen. Die Forschung zielt darauf ab, die Modellleistung für eine verbesserte Benutzererfahrung zu verbessern und gleichzeitig hardwarespezifische Optimierungen zu erforschen, um eine maximale Effizienz bei graphbasierten Berechnungen zu erreichen.
- Leistungsverbesserung: Entwicklung von Techniken zur Verringerung der Inferenzlatenz und zur Verbesserung des Durchsatzes bei Graphenverarbeitungsmodellen ohne Beeinträchtigung der Genauigkeit oder der Fähigkeiten zur Graphenanalyse.
- Optimierung von Graphenalgorithmen: Untersuchung und Implementierung spezieller Methoden zur Optimierung von Graphenalgorithmen, einschließlich graph traversal, message passing und neighborhood sampling,
- Hardware-Beschleunigung: Erforschung hardwarespezifischer Optimierungen für verschiedene Plattformen (GPUs, TPUs, CPUs, Edge Devices) mit Schwerpunkt auf unregelmäßigen Speicherzugriffsmustern, spärlichen Berechnungen und parallelen Ausführungsstrategien speziell für die Graphenverarbeitung.
- Metriken zur Benutzerfreundlichkeit: Definition und Messung von Metriken für die Benutzererfahrung in Bezug auf die Geschwindigkeit der Graphenmodellinferenz und Erstellung von Benchmarks für reale graphenbasierte Anwendungen.
- Kenntnisse der mathematischen Grundlagen des maschinellen Lernens.
- Beherrschung von mindestens einem Graphenverarbeitungssystem (PyG, DGL, GraphScope).
- Erfahrung mit neuronalen Netzwerkarchitekturen.
- Grundlegende CUDA- oder Triton-Programmierkenntnisse sind von Vorteil.
- Gutes Englisch -> Die Arbeit sollte auf Englisch geschrieben werden.
- Verständnis von Speicherhierarchien und Bandbreiten in Linuxsystemen.
- Programmierkenntnisse in Python, C++ oder Zig.
Sebastian Baum
♦
Testing of AI-based systems such as autonomous vehicles is challenging due to many situations and scenarios. Brute force is expensive and has gaps, as we see in practice. We thus use synthetic data for an AI-driven testing. This data covers real-world scenarios to train autonomous systems in a simulation-based environment. The training success is evaluated in a data loop and enhanced to close blind spots and unknown knowns. This thesis targets to integrate a requirements and test engine to an automated test system.
The goal of the thesis is to integrate existing parts of the system. A fully running system shall be implemented. The integration comprises verification and validation checks for the existing parts. Professional tools such as DOORS shall be used for industry-scale AI-based testing of autonomous systems.
Knowledge in Python
Industry-scale software engineering and tools
Work in a self-independent way
Passionate about clean and good quality code
Capable of integrating your work with other parts of the system
Christof Ebert
♦