Die Erfassung der Bedürfnisse der Nutzer nach thermischem Komfort und deren Berücksichtigung in Gebäudeautomationssystemen ist eine der kritischsten Hürden für die Schaffung energieeffizienter Wohn- und Arbeitsumgebungen. Aktuelle Gebäudeautomationssysteme sind darauf ausgelegt, entweder einen durch Standards [1,2] definierten "allgemeinen" Komfort bereitzustellen, oder einfach auf Änderungen der Solltemperatur durch die Nutzer zu "reagieren", beispielsweise über einen wandmontierten Thermostat. Bei keinem dieser Ansätze werden die Komfortbedürfnisse der Nutzer tiefgreifend in die Gebäudesteuerung einbezogen. Somit wird die Möglichkeit verpasst, einen nutzerspezifischen Komfort zu bieten. Genauer gesagt wird die Chance verpasst, nutzerspezifische Komfortbedürfnisse zu erlernen und diesen Komfort bei minimalem Energieverbrauch zu gewährleisten. In diesem Projekt wurden neue Steuerungsalgorithmen entwickelt, die Nutzerdaten zu thermischen Komfortbedürfnissen nutzen, um automatisch nutzerspezifischen Komfort über den Tag hinweg zu bieten. Das Projekt bestand aus drei Hauptteilen: i) Entscheidung darüber, welche Daten (von welchen Sensoren und/oder welchen Umfragefragen) zur Ermittlung der Komfortbedürfnisse der Nutzer berücksichtigt werden sollen, ii) Entwicklung eines Komfortzufriedenheitsmodells und iii) Entwicklung des Steuerungsalgorithmus und dessen Erprobung in Simulation und realer Umgebung im NEST-Gebäude der Empa in Dübendorf. Zu diesem Zweck wurde das Projekt in zwei Hauptphasen unterteilt. Phase 1 bestand aus der Datenerhebung in zwei Einzelbüroeinheiten (Räume 183 und 184) der Nest Sprint-Einheit. Während der Datenerhebung, die in den Wintermonaten stattfand, wurden die Räume von zwei Testpersonen besetzt, und TP-Bewertungen (Thermische Präferenz) wurden periodisch über eine auf einem Tisch-Tablet installierte Umfrage-App erfasst. Zusätzlich wurden Umweltdaten bestehend aus Außen- und Innenvariablen sowie physiologische Daten aufgezeichnet. Mit den gesammelten Daten wurden Support Vector Machine (SVM) basierte PTCMs (Personalisierte Thermische Komfortmodelle) für beide Testpersonen entwickelt. Diese PTCMs lieferten für die beiden Teilnehmer TP-Vorhersagen mit einer Genauigkeit von 89% bzw. 83 %. Das entwickelte PTCM wurde dann in ein Deep Reinforcement Learning (DRL) basierte Controller Framework eingebettet, das die Heizungsventilzustände in jedem der Räume unabhängig moduliert, mit dem Ziel, personalisierten thermischen Komfort zu bieten und den Heizenergieverbrauch zu minimieren. Phase 2 des UC-DPC Projekts beinhaltete somit die Implementierung des PTCM-eingebetteten DRLController-Frameworks in der Nest Sprint-Einheit und die Validierung seiner Leistung durch periodische Sammlung von TP-Bewertungen wie in Phase 1. Der PTCM-DRL-Controller war maßgeblich an der Bereitstellung personalisierter Raumklimabedingungen für beide Testpersonen beteiligt und half, den Heizenergieverbrauch beider Räume in der Nest Sprint-Einheit zu reduzieren. Dies unterstreicht die Notwendigkeit von großangelegten Studien mit vielfältigen Nutzerprofilen, um das volle Potenzial von PTCM eingebetteten DRL-Controllern zur Bereitstellung energieeffizienter und personalisierter Innenraumbedingungen in Schweizer Gebäuden zu realisieren.