#Interview
Prior Labs – und Vorhersagen sind in Sekunden möglich

Das junge KI-Startup Prior Labs, 2024 vom AutoML-Forscher Frank Hutter, Noah Hollmann und Sauraj Gambhir in Freiburg im Breisgau, gegründet, entwickelt mit TabPFN ein “Modell, das die Analyse von Tabellendaten grundlegend verbessert”. Das Team ermöglicht es “Unternehmen präzisere Vorhersagen auf Grundlage ihrer Daten zu treffen”. Balderton Capital, TX Ventures, Hector Foundation, Atlantic Labs und Galion.exe sowie Business Angels investierten zuletzt 9 Millionen Euro in die Jungfirma.
Im Interview mit deutsche-startups.de spricht Prior Labs-Macher Frank Hutter einmal ausführlich über den Stand der Dinge bei Prior Labs.
Wie würdest Du Deiner Großmutter Prior Labs erklären?
Unternehmen speichern ihre wertvollsten Informationen in Zeilen und Spalten, sprich Tabellen, beispielsweise in Excel. Dies nennen wir “tabellarische Daten”. Viele wichtige Entscheidungen stützen sich auf diese Daten, sei es die Umsatzprognose, die Vorhersage des Kundenverhaltens oder, ob jemand für einen Kredit infrage kommt. Um aus diesen Daten genaue Vorhersagen treffen zu können, musste ein Data Scientist bisher für jeden spezifischen Anwendungsfall ein benutzerdefiniertes maschinelles Lernmodell Trainingsdaten sammeln, diese bereinigen und das Modell trainieren. Dieser Prozess kann Tage, Wochen oder sogar Monate dauern. Bei Prior Labs haben wir ein KI-Modell entwickelt, das sofort mit jedem beliebigen Tabellendatensatz funktioniert – ohne dass ein individuelles Training erforderlich ist. Anstatt lange Zeit damit zu verbringen, ein Modell zu entwickeln, können die Data Scientists jetzt in Sekundenschnelle aktuelle Vorhersagen treffen.
Wie wollt Ihr Geld verdienen, also wie genau funktioniert Euer Geschäftsmodell?
Zum einen können Unternehmen unsere KI über eine einfache API integrieren. Hier berechnen wir die Vorhersagen auf unseren Hochleistungs-GPUs. So können Unternehmen schnell und in großem Umfang vorausschauende Analysen nutzen und unsere KI sogar in ihre SaaS-Anwendungen einbetten. Zusätzlich bieten wir Unternehmen, die sich mehr Kontrolle und Sicherheit wünschen, individuelle Lizenzvereinbarungen. Unsere Lösung ist dabei entweder in privaten Virtual Private Clouds (VPCs) oder On-Premise-Umgebungen verfügbar. Hier können sie unser fortschrittlichstes KI-Modell nutzen, das größere Datensätze, Textfunktionen, schnellere Schlussfolgerungen und eine Feinabstimmung mit eigenen Daten unterstützt.
Wie ist die Idee zu Prior Labs entstanden?
Noah und ich haben jahrelang mit Tabellendaten in Bereichen wie Medizin und Wissenschaft gearbeitet. Dabei kamen wir immer wieder an die Grenzen herkömmlicher maschineller Lerntechniken: Modelle, die umfangreiche Anpassungen erforderten, mit kleinen Datensätzen zu kämpfen hatten und sich nicht über verschiedene Anwendungsfälle hinweg verallgemeinern ließen. Wir erkannten die Chance, die Art und Weise, wie Unternehmen mit tabellarischen Daten arbeiten, zu verändern. Dafür schlossen wir uns mit Sauraj zusammen. Er kennt sich mit Finanzdienstleistungen und Investments in KI-Anwendungen für Unternehmen aus, die Data-Science-Teams unterstützen. Gemeinsam erkannten wir das Potenzial für ein Basismodell, das sich branchenübergreifend einsetzen lässt, nur die Hälfte der Daten benötigt und von Anfang an sehr genau ist. Diese Vision führte zur Gründung von Prior Labs.
Wie oder wo hast Du Deine Mitgründer kennengelernt?
Ich war Noahs Doktorvater und wir haben TabPFN gemeinsam an der Universität Freiburg entwickelt. Noah traf Sauraj in Berlin bei einem Networking-Treffen und stellte ihn mir vor. Die Chemie hat von Anfang an gepasst, sodass schnell klar war, Prior Labs gemeinsam aufzubauen.
Was waren die größten Herausforderungen, die Ihr bisher überwinden musstet?
Eine der größten Herausforderungen waren die begrenzten Daten. Im Gegensatz zu Text und Bildern gibt es keinen großen öffentlichen Datensatz mit hochwertigen Tabellendaten. Um dieses Problem zu lösen, entwickelten wir einen einzigartigen Ansatz: Wir trainierten unser tabellarisches Foundation Model TabPFN vorab auf 130 Millionen synthetischen Datensätzen, die reale Probleme aus Wirtschaft und Wissenschaft nachahmen. Eine weitere Herausforderung war die Geschwindigkeit: Herkömmliche Modelle für maschinelles Lernen benötigen wie gesagt lange Trainingszeiten, während unser Modell sofort Ergebnisse liefern musste. Wir haben TabPFN so optimiert, dass es in einem einzigen Vorwärtsdurchlauf ausgeführt werden kann, wodurch es Tausende Male schneller ist als andere KI-Modelle für unsere Anwendungen.
Welches Projekt steht demnächst ganz oben auf eurer Agenda?
Zunächst wollen wir in Berlin und Freiburg ein Expert:innen-Team aufbauen, das die bisherigen Grenzen der KI für tabellarische Daten erweitert. Wir haben mehrere Stellen zu besetzen und suchen nach Menschen, die die Zukunft der Datenwissenschaft maßgeblich prägen wollen. Zudem wollen wir die Modell- und API-Fähigkeiten erweitern. Dazu entwickeln wir schnellere, leistungsfähigere Modelle, die deutlich größere Datensätze verarbeiten können. Unsere API wird sich fortlaufend weiterentwickeln, so zum Beispiel bei der Feinabstimmung auf eigene Daten und der Generierung synthetischer Daten. Und schließlich wollen wir Datenbanken integrieren. Das heißt, unser KI-Modell “TabPFN” wird bald direkt in Datenbanken arbeiten, sodass es nicht mehr erforderlich ist, Daten für Vorhersage-Modellierungen zu verschieben. Dies wird es Unternehmen ermöglichen, KI-gestützte Vorhersagen in Echtzeit durchzuführen – und zwar genau dort, wo ihre Daten liegen.
Startup-Jobs: Auf der Suche nach einer neuen Herausforderung? In der unserer Jobbörse findet Ihr Stellenanzeigen von Startups und Unternehmen.