Courtesy of InterestingEngineering
Para ilmuwan dari Arc Institute telah menciptakan model bahasa besar bernama Evo yang dirancang untuk memahami data urutan biologis atau kode genetik. Evo dilatih dengan menggunakan jutaan mikroba, bukan kata-kata, sehingga dapat memprediksi bagaimana perubahan kecil dalam urutan DNA dapat mempengaruhi seluruh organisme. Meskipun saat ini Evo belum dapat menangani data manusia, model ini berpotensi menjadi alat yang kuat bagi peneliti medis untuk memahami fungsi DNA dan RNA serta mempercepat kemampuan kita dalam merekayasa kehidupan.
Evo mampu menganalisis 2,7 juta genom prokariotik dan phage, dan dapat menghasilkan urutan kode baru. Model ini menangkap dua aspek penting dalam biologi: multimodalitas yang mengintegrasikan DNA, RNA, dan protein, serta multiskala yang mencakup berbagai tingkat fungsi biologis. Hasil awal menunjukkan bahwa Evo dapat menghasilkan komponen protein dan RNA yang melindungi terhadap infeksi virus, meskipun beberapa urutan DNA yang dihasilkan tidak sepenuhnya masuk akal. Ini adalah langkah awal yang menjanjikan dalam penerapan pembelajaran mesin di bidang biologi.