Nijisanji, agensi VTuber asal Jepang, membuka akun Vox Akuma di situs berbagi video Tiongkok, Bilibili, pada 1 Mei 2022. Dalam periode awal kehadirannya di platform tersebut, akun Vox Akuma dilaporkan mengumpulkan sekitar 700.000 pelanggan dan menghasilkan 1,1 juta yuan atau sekitar Rp2 miliar.
Vox Akuma termasuk dalam kategori YouTuber virtual atau VTuber yang tengah berkembang. Model hiburan ini mengandalkan pertunjukan, siaran permainan, serta interaksi waktu nyata dengan penonton. Sumber pendapatan VTuber umumnya berasal dari gabungan tip pemirsa dan komisi iklan.
Apa itu VTuber dan siapa audiensnya
Berbeda dari kreator konten biasa yang tampil dengan wajah asli, VTuber menggunakan avatar digital untuk tampil di depan publik. Audiens utama mereka banyak berasal dari kalangan muda—dari akhir remaja hingga awal usia 30-an—yang tumbuh dalam budaya “ACG”, istilah yang merujuk pada animasi, komik, dan gim yang dipengaruhi budaya Jepang.
Seiring generasi tersebut bertambah besar, VTuber berkembang dari fandom yang bersifat ceruk menjadi fenomena budaya sekaligus industri yang menguntungkan.
Dari Hatsune Miku hingga model VTuber modern
Perkembangan idola virtual kerap ditelusuri hingga ke Hatsune Miku, bintang pop virtual berambut biru yang “lahir” pada 2007. Karakter ini dibuat oleh Crypton Future Media menggunakan perangkat lunak penyintesis suara Vocaloid. Pertunjukan langsungnya menampilkan proyeksi holografik yang disambut penggemar layaknya konser musik pada umumnya.
Hatsune Miku menghasilkan pendapatan dari dukungan merek, pertunjukan, serta gim berlisensi. Karakter virtual juga dipandang memiliki keunggulan: tidak menua, tidak keluar dari naskah, tidak terseret skandal, dan tidak membutuhkan istirahat.
Di Tiongkok, berbagai karakter idola virtual disebut sebagai peniru atau penerus konsep serupa, termasuk Luo Tianyi, Oriental Gardenia, dan Violet, yang disebut rutin tampil dalam acara perusahaan maupun gala Festival Musim Semi di tingkat provinsi atau kota.
Namun, teknologi yang digunakan untuk pertunjukan bergaya holografik dinilai mahal dan kerap menghasilkan penampilan yang tidak stabil. Industri VTuber disebut benar-benar melesat setelah muncul model pemain virtual yang lebih murah pada 2017 melalui debut Kizuna AI, yang digambarkan sebagai VTuber sejati pertama.
Peran manusia di balik avatar
Berbeda dari karakter yang sepenuhnya diprogram, Kizuna AI digerakkan oleh seorang pemain manusia dengan bantuan teknologi penangkapan gerak dan aplikasi wajah. Di Tiongkok, VTuber yang digerakkan manusia ini disebut pitao ren (“manusia cangkang”), sedangkan pelaku di baliknya dikenal sebagai zhongzhi ren (“orang di dalam cangkang”).
Salah satu contoh populer di Tiongkok adalah A-SOUL, grup idola virtual beranggotakan lima karakter yang diluncurkan Yuehua Entertainment pada akhir 2020. Kelompok ini memperkenalkan karakter dengan persona berbeda dan mengusung tagline yongbu tafang, yang secara harfiah diterjemahkan sebagai “kami tidak akan pernah meruntuhkan rumah”—istilah yang merujuk pada skandal atau pemberitaan negatif yang dapat meruntuhkan citra idola.
Meski demikian, ketegangan antara perusahaan, pemain, dan penggemar disebut menjadi salah satu kontradiksi mendasar dalam industri. Bagi perusahaan, avatar atau “cangkang” adalah bintang; sementara bagi penggemar, pemain manusia dipandang sebagai “jiwa” dari idola tersebut.
Pendekatan Nijisanji dan sosok Vox Akuma
Nijisanji disebut mengambil pendekatan yang lebih longgar dalam mengelola karakter dan pemain. Setelah menandatangani zhongzhi ren, perusahaan memberikan akses ke platform IP, desain avatar, dan perangkat lunak. Sebagai gantinya, livestreamer diminta memenuhi sejumlah acara dan kolaborasi yang ditentukan bersama idola Nijisanji lainnya.
Pemain yang lebih populer dapat memperoleh dukungan tambahan, termasuk kemunculan karakter dalam gim, film, hingga animasi seluruh tubuh untuk kegiatan komersial offline seperti konser. Sementara itu, frekuensi siaran, jenis konten, dan aktivitas di luar siaran disebut lebih banyak diserahkan kepada masing-masing kreator.
Vox Akuma digambarkan memerankan karakter penguasa berusia 400 tahun yang berubah menjadi iblis setelah terbunuh pada periode Negara-Negara Berperang Jepang (1467–1615). Ia disebut memiliki lebih dari 800.000 pelanggan di YouTube dan lebih dari 1 juta di Bilibili. Pemain di balik Vox dikenal sering melakukan siaran tujuh hari seminggu, kadang hingga empat kali dalam sehari, serta kerap memperlihatkan sisi personal dalam interaksi dengan penggemar.
Dalam salah satu siaran langsung pada awal Februari, ia menghabiskan sekitar setengah jam untuk menyampaikan terima kasih setelah menerima pesan dari penggemar Tiongkok yang merayakan Tahun Baru Imlek. Pada 25 April, ia juga disebut menangis saat sesi perayaan ulang tahun yang disiapkan penggemar. Ia beberapa kali menjelaskan gangguan teknis sebagai bagian dari proses belajar, sesuai karakter yang ia mainkan.
Isu ketenagakerjaan dan risiko industri
Di tengah perhatian pada teknologi, diskusi mengenai masa depan industri VTuber disebut jarang berfokus pada para zhongzhi ren. Situasi ini dinilai berisiko, mengingat persoalan di balik layar dapat memicu respons besar dari komunitas penggemar.
Pada 10 Mei, beberapa hari setelah debut Vox Akuma di Bilibili, Yuehua mengakhiri kontrak zhongzhi ren di balik karakter Carol A-SOUL. Setelah itu, tuduhan perundungan dan eksploitasi yang disampaikan artis tersebut di akun media sosial pribadinya menjadi viral.
Pelaku mengungkapkan bahwa ia bekerja tujuh hari seminggu dengan bayaran 7.000 yuan per bulan, sementara kelompoknya disebut menghasilkan jutaan setiap tahun. Sebagai bentuk protes, ratusan ribu penggemar A-SOUL dilaporkan berhenti berlangganan dari kanal grup.
Peristiwa tersebut menunjukkan bahwa citra idola virtual tidak sepenuhnya kebal dari krisis, terutama ketika isu yang melibatkan manusia di balik avatar muncul ke permukaan.

