Pengumuman penutupan Microsoft Academic akhir tahun ini, mungkin telah membuat komunitas riset sebagian besar tidak tergerak, meskipun kehancurannya memiliki implikasi signifikan bagi mereka yang bekerja dengan basis data substansial layanan. Di sini, Aaron Tay, Alberto Martín-Martín, dan Sven E. Hug¸ membahas apa yang membedakan Microsoft Academic dari para pesaingnya dan konsekuensi potensial dari penarikan Microsoft dari metadata ilmiah untuk pengembangan infrastruktur penelitian terbuka.
Baru-baru ini, Microsoft mengumumkan akan menutup Microsoft Academic, mesin pencari akademik terbesar kedua setelah Google Cendekia. Meskipun komunitas ilmiah global tidak terlalu memperhatikan pengumuman ini, banyak ilmuwan komputer, meta-peneliti, pustakawan, dan pemula terkejut, karena mereka telah membangun ekosistem layanan informasi di sekitar basis data.
Microsoft Academic bukanlah upaya pertama perusahaan untuk
membangun alat pencarian literatur. Proyek sebelumnya, Microsoft Academic
Search, berjalan dari 2009 hingga 2012 dan mengalami kerusakan parah sebelum
diluncurkan kembali secara resmi sebagai Microsoft Academic pada 2016. Ini
menunjukkan bagaimana Microsoft tidak pernah berniat memasuki bisnis metadata
ilmiah. Sebagai gantinya, raksasa teknologi tersebut telah menggunakan data
pada komunikasi ilmiah sebagai tempat pengujian untuk data besar dan teknologi
kecerdasan buatan (AI), seperti yang disarankan oleh sebuah artikel baru-baru
ini oleh para peneliti Redmond. Dikabarkan bahwa Microsoft mungkin menawarkan
teknologi yang diuji untuk mengumpulkan pengetahuan dari dokumen di Office 365.
Mesin pencari yang canggih
Dibandingkan dengan indeks kutipan tradisional, seperti Web
of Science dan Scopus, sebagian besar didasarkan pada jurnal tertentu, kekuatan
Microsoft Academic adalah cara merayapi web dan penggunaan teknologi AI untuk
mengisi basis datanya. Oleh karena itu, tidak mengherankan bahwa Microsoft
Academic lebih cepat dalam mengindeks publikasi baru dan berisi lebih banyak
catatan (194 juta, tanpa paten) daripada Koleksi Inti Web of Science (79 juta)
dan Scopus (75 juta). Microsoft Academic juga mencakup lebih banyak jenis
publikasi (pracetak, kertas kerja, disertasi, dll.) dan bersinar di bidang
penelitian yang database kutipan tradisional sering tidak tercakup dengan baik,
seperti ilmu komputer, ilmu sosial, dan humaniora.
Kekuatan Microsoft Academic adalah cara merayapi web dan penggunaan
teknologi AI untuk mengisi basis datanya.
Keuntungan utama dari Microsoft Academic dibandingkan Google
Scholar adalah antarmuka pencarian, yang untuk saat ini masih menawarkan banyak
pilihan pemfilteran dan penyortiran dan menyediakan berbagai peringkat (topik,
jurnal, institusi, dll.) serta visualisasi statistik ringkasan. Meskipun mesin
pencari ini gratis dan memiliki jejaring sosial terintegrasi untuk akademisi,
mesin pencari ini tidak pernah populer di kalangan peneliti, seperti yang dapat
dilihat dari statistik lalu lintas web:
Total kunjungan pada April 2021 menurut SimilarWeb (dalam
juta)
scholar.google.com 137.5
semanticscholar.org 8.9
scopus.com 5.2
webofknowledge.com 4.4
akademic.microsoft.com 0.7
Alasan utama untuk penggunaan yang rendah ini kemungkinan
adalah antarmuka pencarian itu sendiri. Ini berbeda secara fundamental dari
sistem pencarian akademis tradisional karena didorong oleh teknologi AI. Secara
khusus, antarmuka menawarkan pencarian semantik yang sebenarnya, bukan
pencarian kata kunci biasa dengan operator Boolean. Atau seperti yang pernah
dijelaskan Microsoft: 'Microsoft Academic memahami arti kata, tidak hanya
mencocokkan kata kunci dengan konten. Misalnya, ketika Anda mengetik
"Microsoft", ia tahu maksud Anda institusi, dan menunjukkan kepada
Anda publikasi yang ditulis oleh peneliti yang berafiliasi dengan Microsoft.'
Selain itu, mesin pencari didasarkan pada lebih dari 700.000 'bidang studi'
(yaitu, topik atau konsep) yang dibuat dan terus dikembangkan oleh algoritme,
sedangkan sistem pencarian lain menggunakan klasifikasi yang tetap, dikuratori
oleh manusia, dan tidak terlalu rumit. Selain itu, mesin pencari menggunakan
dua metrik unik, saliency dan perkiraan jumlah kutipan, yang sulit dipahami dan
ditafsirkan oleh sebagian besar pengguna. Secara keseluruhan, fitur-fitur
berbasis AI ini menciptakan pengalaman pencarian yang sangat berbeda dari yang
biasa digunakan pengguna. Dengan demikian, tampaknya teknologi AI yang
digunakan terlalu avant-garde untuk pengguna atau tidak cukup matang.
Tersedia Banyak data gratis di Microsoft Academic
Sementara mesin pencari belum dianut oleh komunitas ilmiah,
data yang mendasarinya, Grafik Akademik Microsoft, telah menarik banyak
pengguna. Ada beberapa alasan untuk ini. Kumpulan datanya sangat besar,
terstruktur dengan baik, dan terperinci. Penggunaannya gratis, dan aksesnya
mudah (API atau dump data penuh). Sebaliknya, akses langsung ke data Google
Cendekia tidak mungkin, dan data hanya dapat diambil dari Google Cendekia
sampai batas yang sangat terbatas. Meskipun Microsoft secara eksklusif
menggunakan teknologi AI untuk mengumpulkan dan mengkurasi data, kualitas data
cukup akurat dan cocok untuk analisis skala besar dari beberapa aspek
komunikasi ilmiah.
Microsoft Academic telah memungkinkan peneliti dan perusahaan
komersial untuk bekerja dengan metadata yang komprehensif dengan sedikit biaya
Dengan cara ini, Microsoft Academic telah memungkinkan
peneliti dan perusahaan komersial sama-sama bekerja dengan metadata yang
komprehensif dengan sedikit biaya. Sebelum Microsoft membuat databasenya
tersedia, hanya peneliti di beberapa institut (di negara kaya) yang memiliki akses
ke kumpulan data besar, dan perusahaan yang memiliki data semacam itu
kebanyakan menggunakannya untuk produk mereka sendiri. Makalah yang
memperkenalkan Microsoft Academic Graph telah dikutip lebih dari 500 kali sejak
2015, yang menunjukkan betapa bergunanya database dalam penelitian. Grafik juga
digunakan di banyak alat dan layanan komersial dan non-komersial (mis.,
VOSviewer, Unsub, Litmaps, scite). Dan bahkan ada beberapa database bibliografi
dan mesin pencari yang memanfaatkan kekayaan Microsoft Academic (misalnya,
Semantic Scholar, The Lens, Scinapse).
Meskipun penutupan Microsoft Academic tidak akan mempengaruhi
kinerja alat dan layanan ini dengan cara yang sama, jelas bahwa sumber daya
yang berharga akan hilang pada akhir tahun ini. Masih harus dilihat apakah dan
bagaimana itu bisa dan akan diganti. Solusi paling murah adalah membayar
Microsoft untuk melanjutkan database, yang tentu saja mengharuskan Microsoft
untuk tetap menjalankannya. Biaya komputasi awan tahunan untuk memperbarui
konten Grafik Akademik Microsoft kira-kira sama dengan gaji seorang ilmuwan
data berpengalaman. Seorang pengembang database baru-baru ini memperkirakan
bahwa mempertahankan Microsoft Academic pada tingkat teknis saat ini akan
menelan biaya sekitar sepertiga dari jumlah yang akan dibayarkan universitas
menengah untuk data dari indeks kutipan tradisional.
Menuju infrastruktur penelitian terbuka?
Microsoft Academic telah menunjukkan nilai metadata yang
tersedia secara terbuka yang telah dikumpulkan dan dikuratori oleh teknologi
AI. Ini telah memberikan lahan subur bagi para peneliti dan perusahaan
komersial. Tentu saja ada sumber metadata terbuka lainnya. Misalnya, Crossref
berisi lebih dari 125 juta catatan, 48 juta di antaranya memiliki referensi
terbuka berkat Initiative for Open Citations dan penerbit yang berkolaborasi.
Namun, Crossref lebih kecil, berisi data yang kurang detail, kurang konsisten
dikuratori, dan hanya mengindeks publikasi dengan DOI (pengidentifikasi objek
digital).
Pada akhirnya, proyek Microsoft telah menunjukkan bahwa tidak
cukup hanya membuat database tersedia untuk umum – database juga harus
berkelanjutan. Jika kita menginginkan database yang terbuka dan berkelanjutan,
mungkin ide yang baik untuk menginvestasikan lebih banyak waktu dan sumber daya
dalam membangunnya. Dan untuk memulainya, kami dapat mendukung, misalnya,
mereka yang berencana membangun sumber terbuka dan pengganti Microsoft Academic
yang bebas digunakan.
Catatan: Artikel ini memberikan pandangan penulis, dan bukan
posisi blog Dampak Ilmu Sosial, atau London School of Economics. Harap tinjau
Kebijakan Komentar kami jika Anda memiliki kekhawatiran tentang memposting
komentar di bawah.
Kredit Gambar: Alexandre Debiève melalui Unsplash.
Aaron Tay
Aaron Tay
adalah Lead Data Services di Singapore Management University Libraries. Dia
memiliki minat di bidang-bidang seperti sistem penemuan akademik, bibliometrik
dan Akses Terbuka dan telah menjalankan blog – Renungan tentang kepustakawanan
https://musingsaboutlibrarianship.blogspot.com/ sejak 2009. (ORCID
0000-0003-0159-013X)
Alberto Martín-Martín
Alberto Martín-Martín adalah peneliti postdoctoral yang
bekerja pada bibliometrik dan komunikasi ilmiah di Universidad de Granada,
Spanyol.
No comments:
Post a Comment
Thanks for your comment...I am looking forward your next visit..