Teknologi mereka membangun database lagu dan musisi dengan cara mengenali nada dan tempo musik, serta menghubungkan karya-karya seni dalam konteks budaya bersama.
Data tambahan seperti tanggal rilis lagu dan metrik seperti volume, durasi, dan seberapa besar kemungkinan lagu tersebut mengundang orang untuk menari, ikut menentukan lagu mana yang akan diputar sesuai dengan selera pengguna.
Dari sinilah, lahir berbagai playlist seperti “Daily Mix” dan “Discover Weekly”. Playlist lain seperti “Time Capsules” dan “On Repeat” dikumpulkan berdasarkan lagu-lagu yang paling sering didengarkan oleh pengguna, untuk memastikan mereka terus terhubung dengan lagu-lagu yang mereka sukai atau bahkan untuk kembali mendengarkan lagu-lagu yang sudah lama tidak mereka dengar.
Menurut Reece Hayden, seorang analis senior di ABI Research, dia meyakini bahwa model bahasa besar (LLM) bisa bermanfaat untuk meningkatkan interaksi di semua platform Spotify.
“Model bahasa besar bisa meningkatkan personalisasi, memberikan rekomendasi yang lebih baik, dan memastikan rekomendasi tersebut lebih sesuai dengan minat pengguna dengan cara memahami seluruh teks atau video, bukan hanya mengandalkan kata kunci atau metadata,” katanya.
Dia menambahkan bahwa berbeda dengan “model prediktif dasar” yang hanya bergantung pada kata kunci atau metadata, LLM bisa memahami dan menginterpretasi podcast untuk melihat sejauh mana podcast tersebut sesuai dengan minat pengguna.
Dengan menganalisis semua data pengguna, LLM bisa mendapatkan pemahaman yang lebih dalam mengenai preferensi mereka.
“Menggunakan LLM untuk memahami semua podcast atau buku audio membutuhkan banyak sumber daya, dan mungkin memberikan nilai tambah yang terbatas dibandingkan dengan model prediktif dasar. Namun, LLM membawa aspek privasi data tambahan dan juga menantang dalam hal biaya dan sumber daya yang dibutuhkan, yang bisa jadi cukup signifikan,” tambahnya.
Dia yakin bahwa alat terjemahan suara seperti Whisper bisa membantu dalam menerjemahkan podcast, meski menyadari bahwa kesalahan masih mungkin terjadi dalam bentuk kalimat atau frasa yang salah saat dipelajari oleh AI generatif.
“Mengingat adanya data, alat terjemahan seperti Whisper akan semakin membaik dengan cepat, pastikan tingkat akurasi yang tinggi,” katanya.
“Namun, kelemahan Whisper terletak pada fokusnya yang lebih kuat pada menerjemahkan dari bahasa lain ke bahasa Inggris, sedangkan sebagian besar podcast direkam dalam bahasa Inggris. Oleh karena itu, mungkin tidak akan efektif secara keseluruhan,” tandasnya.
Peran Kecerdasan Buatan dalam Transformasi Spotify: Dari PHK Massal hingga Revolusi Podcast
Ke depan, Spotify berpotensi untuk menjadi pemimpin dalam podcasting global dengan pengembangan teknologi AI yang terus-menerus. Transformasi ini memungkinkan pengalaman pengguna yang lebih personal, namun juga membawa sejumlah pertimbangan terkait dengan penggunaan teknologi AI dalam konten audio.