Kunstmatige intelligentie bewijst nu al dat het de ontwikkeling van geneesmiddelen kan versnellen en ons begrip van ziekten kan verbeteren. Maar om AI in nieuwe behandelingen om te zetten, moeten we de nieuwste, krachtigste modellen in handen van wetenschappers krijgen.
Het probleem is dat de meeste wetenschappers geen experts op het gebied van machine learning zijn. Nu helpt het bedrijf OpenProtein.AI wetenschappers om voorop te blijven lopen op het gebied van AI met een no-code platform dat hen toegang geeft tot krachtige basismodellen en een reeks tools voor het ontwerpen van eiwitten, het voorspellen van de eiwitstructuur en -functie, en trainingsmodellen.
Het bedrijf, opgericht door Tristan Bepler PhD ’20 en voormalig MIT-universitair hoofddocent Tim Lu PhD ’07, rust onderzoekers in farmaceutische en biotechbedrijven van elke omvang al uit met zijn tools, waaronder intern ontwikkelde basismodellen voor eiwitengineering. OpenProtein.AI biedt zijn platform ook gratis aan wetenschappers in de academische wereld aan.
“Het is momenteel een heel opwindende tijd omdat deze modellen niet alleen de eiwitengineering efficiënter kunnen maken – wat de ontwikkelingscycli voor therapeutische en industriële toepassingen verkort – ze kunnen ook ons vermogen vergroten om nieuwe eiwitten met specifieke eigenschappen te ontwerpen”, zegt Bepler. “We denken er ook over om deze benaderingen toe te passen op niet-eiwitmodaliteiten. Het grote geheel is dat we een taal creëren voor het beschrijven van biologische systemen.”
Biologie bevorderen met AI
Bepler kwam in 2014 naar MIT als onderdeel van het Computational and Systems Biology PhD-programma, waar hij studeerde bij Bonnie Berger, MIT’s Simons Professor of Applied Mathematics. Daar besefte hij hoe weinig we begrijpen van de moleculen die de bouwstenen van de biologie vormen.
“We hadden biomoleculen en eiwitten niet goed genoeg gekarakteriseerd om goede voorspellende modellen te creëren van wat bijvoorbeeld een heel genoomcircuit zal doen, of hoe een eiwitinteractienetwerk zich zal gedragen”, herinnert Bepler zich. “Het heeft mij geïnteresseerd gemaakt in het begrijpen van eiwitten op een fijner niveau.”
Bepler begon manieren te onderzoeken om de ketens van aminozuren waaruit eiwitten bestaan te voorspellen door evolutionaire gegevens te analyseren. Dit was voordat Google AlphaFold uitbracht, een krachtig voorspellingsmodel voor de eiwitstructuur. Het werk leidde tot een van de eerste generatieve AI-modellen voor het begrijpen en ontwerpen van eiwitten – wat het team een eiwittaalmodel noemt.
“Ik was erg enthousiast over het klassieke raamwerk van eiwitten en de relaties tussen hun sequentie, structuur en functie. We begrijpen die verbanden niet goed”, zegt Bepler. “Dus hoe kunnen we deze basismodellen gebruiken om de ‘structuur’-component over te slaan en rechtstreeks van sequentie naar functie te gaan?”
Na zijn doctoraat in 2020 ging Bepler als postdoc naar Lu’s laboratorium bij de afdeling Biological Engineering van MIT.
“Dit was rond de tijd dat het idee om AI te integreren met biologie steeds populairder werd”, herinnert Lu zich. “Tristan heeft ons geholpen betere computermodellen voor biologisch ontwerp te bouwen. We realiseerden ons ook dat er een kloof bestond tussen de meest geavanceerde tools die beschikbaar zijn en de biologen, die deze dingen graag zouden willen gebruiken, maar niet weten hoe ze moeten coderen. OpenProtein kwam voort uit het idee om de toegang tot deze tools te verbreden.”
Bepler had als onderdeel van zijn doctoraat in de voorhoede van AI gewerkt. Hij wist dat de technologie wetenschappers zou kunnen helpen hun werk te versnellen.
“We zijn begonnen met het idee om een platform voor algemene doeleinden te bouwen voor machine learning-in-the-loop eiwitengineering”, zegt Bepler. “We wilden iets bouwen dat gebruiksvriendelijk was, omdat ideeën voor machinaal leren nogal esoterisch zijn. Ze vereisen implementatie, GPU’s, verfijning en het ontwerpen van bibliotheken met sequenties. Vooral in die tijd was het voor biologen veel om te leren.”
Het platform van OpenProtein beschikt daarentegen over een intuïtieve webinterface waarmee biologen gegevens kunnen uploaden en eiwitengineeringwerk kunnen uitvoeren met machinaal leren. Het beschikt over een reeks open-sourcemodellen, waaronder PoET, het vlaggenschip eiwittaalmodel van OpenProtein.
PoET, een afkorting van Protein Evolutionary Transformer, is getraind in eiwitgroepen om sets van verwante eiwitten te genereren. Bepler en zijn medewerkers lieten zien dat het de evolutionaire beperkingen van eiwitten kon generaliseren en nieuwe informatie over eiwitsequenties kon opnemen zonder omscholing, waardoor andere onderzoekers experimentele gegevens konden toevoegen om het model te verbeteren.
“Onderzoekers kunnen hun eigen gegevens gebruiken om modellen te trainen en eiwitsequenties te optimaliseren, en vervolgens kunnen ze onze andere tools gebruiken om die eiwitten te analyseren”, zegt Bepler. “Mensen genereren bibliotheken met eiwitsequenties in silico (op computers) en laten deze vervolgens door voorspellende modellen lopen om validatie en structurele voorspellers te krijgen. Het is in feite een front-end zonder code, maar we hebben ook API’s voor mensen die er met code toegang toe willen hebben.”
De modellen helpen onderzoekers sneller eiwitten te ontwerpen en vervolgens te beslissen welke veelbelovend genoeg zijn voor verdere laboratoriumtests. Onderzoekers kunnen ook interessante eiwitten invoeren, en de modellen kunnen nieuwe genereren met vergelijkbare eigenschappen.
Sinds de oprichting is het team van OpenProtein doorgegaan met het toevoegen van tools aan zijn platform voor onderzoekers, ongeacht hun laboratoriumgrootte of middelen.
“We hebben heel hard geprobeerd om van het platform een gereedschapskist met een open einde te maken”, zegt Bepler. “Het heeft specifieke workflows, maar is niet specifiek gebonden aan één eiwitfunctie of klasse van eiwitten. Een van de mooie dingen van deze modellen is dat ze heel goed zijn in het breed begrijpen van eiwitten. Ze leren over de hele ruimte van mogelijke eiwitten.”
Het mogelijk maken van de volgende generatie therapieën
Het grote farmaceutische bedrijf Boehringer Ingelheim begon begin 2025 het OpenProtein-platform te gebruiken. Onlangs kondigden de bedrijven een uitgebreide samenwerking aan waarbij het platform en de modellen van OpenProtein zullen worden ingebed in het werk van Boehringer Ingelheim bij het ontwikkelen van eiwitten voor de behandeling van ziekten zoals kanker en auto-immuun- of ontstekingsaandoeningen.
Vorig jaar bracht OpenProtein ook een nieuwe versie uit van zijn eiwittaalmodel, PoET-2, die beter presteert dan veel grotere modellen terwijl het een klein deel van de computerbronnen en experimentele gegevens gebruikt.
“We willen heel graag de vraag oplossen hoe we eiwitten beschrijven”, zegt Bepler. “Wat is de betekenisvolle, domeinspecifieke taal van eiwitbeperkingen die we gebruiken terwijl we ze genereren? Hoe kunnen we meer evolutionaire beperkingen invoeren? Hoe kunnen we een enzymatische reactie beschrijven die een eiwit uitvoert, zodat een model sequenties kan genereren om die reactie uit te voeren?
Vooruit, de oprichters hopen modellen te maken die rekening houden met de veranderende, onderling verbonden aard van de eiwitfunctie.
“Het gebied waar ik enthousiast over ben, gaat verder dan eiwitbindingsgebeurtenissen om deze modellen te gebruiken om dynamische kenmerken te voorspellen en te ontwerpen, waarbij het eiwit twee, drie of vier biologische mechanismen tegelijkertijd moet inschakelen, of zijn functie moet veranderen na binding”, zegt Lu, die momenteel een adviserende rol vervult voor het bedrijf.
Terwijl de vooruitgang op het gebied van AI voortschrijdt, blijft OpenProtein het als missie zien om wetenschappers de beste hulpmiddelen te geven om sneller nieuwe behandelingen te ontwikkelen.
“Naarmate het werk complexer wordt, met benaderingen die zaken als eiwitlogica en dynamische therapieën omvatten, worden de bestaande experimentele toolsets beperkend”, zegt Lu. “Het is heel belangrijk om open ecosystemen rond AI en biologie te creëren. Het risico bestaat dat AI-bronnen zo geconcentreerd raken dat de gemiddelde onderzoeker ze niet kan gebruiken. Open toegang is superbelangrijk voor het wetenschappelijke veld om vooruitgang te boeken.”



