Pomodo
HomeTeknologiBisnisSainsFinansial

Wikidata Embedding: Membawa Data Wikipedia ke Dunia AI dengan Teknologi Semantik

Teknologi
Kecerdasan Buatan
artificial-intelligence (5mo ago) artificial-intelligence (5mo ago)
01 Okt 2025
269 dibaca
2 menit
Wikidata Embedding: Membawa Data Wikipedia ke Dunia AI dengan Teknologi Semantik

Rangkuman 15 Detik

Proyek Embedding Wikidata meningkatkan aksesibilitas data Wikipedia untuk model AI.
Kolaborasi antara organisasi dan perusahaan teknologi penting dalam pengembangan sistem AI yang lebih baik.
Data yang terstruktur dengan baik dari Wikipedia dapat meningkatkan akurasi dan relevansi dalam aplikasi kecerdasan buatan.
Wikimedia Deutschland mengumumkan sebuah proyek baru bernama Wikidata Embedding Project yang bertujuan membuat data Wikipedia dan multiplatform Wikimedia lebih mudah diakses oleh model AI. Proyek ini menggunakan teknologi pencarian semantik berbasis vektor sehingga AI dapat memahami arti dan hubungan antar kata lebih baik, terutama dalam menjawab kueri bahasa alami. Database yang dikembangkan terdiri dari hampir 120 juta entri dan kini mendukung Model Context Protocol (MCP) yang membuat AI dapat berinteraksi langsung dengan sumber data secara efisien. Kerjasama proyek ini melibatkan Jina.AI, perusahaan yang berfokus pada neural search, dan DataStax yang dimiliki oleh IBM. Sebelumnya, Wikidata hanya mendukung pencarian kata kunci dan query SPARQL yang kompleks. Dengan pencarian berbasis vektor, sistem baru ini lebih cocok untuk aplikasi retrieval-augmented generation (RAG), yang memungkinkan model AI menarik data eksternal secara langsung dan akurat serta sesuai dengan verifikasi editorial Wikipedia. Data yang disajikan juga diatur sedemikian rupa sehingga AI bisa menangkap konteks semantik, misalnya kata 'scientist' tidak hanya menghasilkan daftar ilmuwan terkenal, tapi juga terjemahan ke berbagai bahasa, gambar terkait, serta konsep berkaitan seperti 'researcher' dan 'scholar'. Dengan demikian, hasil pencarian menjadi lebih kaya dan informatif. Inisiatif ini penting di tengah persaingan ketat di dunia AI yang memerlukan data berkualitas tinggi dan terverifikasi. Dengan proyek ini, Wikimedia menunjukkan bahwa pengembangan AI dapat terjadi secara terbuka dan kolaboratif tanpa harus didominasi oleh perusahaan besar seperti Google atau Meta.

Analisis Ahli

Philippe Saadé
Menyatakan bahwa proyek ini membuktikan bahwa AI yang kuat tidak harus dikendalikan oleh segelintir perusahaan, melainkan dapat dibangun secara terbuka dan kolaboratif untuk melayani semua orang.