La startup di AI SandboxAQ, sostenuta da Nvidia, crea nuovi dati per accelerare la scoperta di farmaci
SandboxAQ, una startup di intelligenza artificiale nata da Alphabet GOOG Google e sostenuta da Nvidia
NVDA, ha rilasciato mercoledì una serie di dati che spera possano accelerare la scoperta di nuovi trattamenti medici aiutando gli scienziati a capire come i farmaci si legano alle proteine.
L'obiettivo è aiutare gli scienziati a prevedere se un farmaco si legherà al suo bersaglio nel corpo umano.
Ma i dati, pur essendo supportati da esperimenti scientifici reali, non provengono da un laboratorio. SandboxAQ, che ha raccolto quasi un miliardo di dollari in capitale di rischio , ha invece generato i dati utilizzando i chip di Nvidia e li inserirà in modelli di intelligenza artificiale che spera possano essere utilizzati dagli scienziati per prevedere rapidamente se una piccola molecola farmaceutica si legherà alla proteina bersaglio dei ricercatori, una domanda chiave a cui è necessario rispondere prima che un candidato farmaco possa andare avanti.
Ad esempio, se un farmaco è destinato a inibire un processo biologico come la progressione di una malattia, gli scienziati possono usare lo strumento per prevedere se la molecola del farmaco si legherà alle proteine coinvolte in quel processo.
L'approccio è un campo emergente che combina le tradizionali tecniche di calcolo scientifico con i progressi dell'intelligenza artificiale. In molti campi, gli scienziati dispongono da tempo di equazioni in grado di prevedere con precisione come gli atomi si combinano in molecole.
Ma anche per le molecole farmaceutiche tridimensionali relativamente piccole, le combinazioni potenziali diventano troppo vaste per essere calcolate manualmente, anche con i computer più veloci di oggi. L'approccio di SandboxAQ è stato quindi quello di utilizzare i dati sperimentali esistenti per calcolare circa 5,2 milioni di nuove molecole tridimensionali "sintetiche": molecole che non sono state osservate nel mondo reale, ma che sono state calcolate con equazioni basate su dati reali.
Questi dati sintetici, che SandboxAQ sta rilasciando pubblicamente, possono essere utilizzati per addestrare modelli di intelligenza artificiale in grado di prevedere se una nuova molecola di farmaco è in grado di aderire alla proteina a cui si rivolgono i ricercatori in una frazione del tempo necessario per calcolarla manualmente, pur mantenendo la precisione. SandboxAQ richiederà un corrispettivo in denaro per i propri modelli di intelligenza artificiale sviluppati con i dati, che spera di ottenere risultati in grado di rivaleggiare con gli esperimenti di laboratorio, ma in modo virtuale.
"Questo è un problema di lunga data in biologia che tutti noi, come industria, abbiamo cercato di risolvere", ha detto martedì a Reuters Nadia Harhen, direttore generale della simulazione AI di SandboxAQ. "Tutte queste strutture generate computazionalmente sono etichettate con i dati sperimentali di base e quindi, quando si sceglie questo set di dati e si addestrano i modelli, è possibile utilizzare i dati sintetici in un modo che non è mai stato fatto prima"