Compute-used billing, Google AI Ultra, Gemini compute limit, AI Pro, dan biaya penggunaan AI kini mulai menjadi kata kunci penting bagi siapa pun yang memakai AI untuk kerja harian, coding, riset, konten, atau otomasi.
Key Takeaways
- Model pembayaran AI mulai bergeser dari batas prompt harian ke sistem “compute-used”, yaitu biaya atau limit yang dihitung dari beban komputasi.
- Prompt teks ringan tidak lagi diperlakukan sama dengan tugas berat seperti video, coding agent, analisis dokumen panjang, atau percakapan berjam-jam.
- Google dilaporkan mulai memakai pendekatan yang memperhitungkan kompleksitas prompt, fitur yang dipakai, panjang chat, serta refresh limit tiap beberapa jam sampai batas mingguan.
- Skema seperti ini terasa lebih adil untuk banyak pengguna, tetapi kamu perlu lebih paham cara mengatur workflow agar compute tidak cepat habis.
- Kemungkinan besar vendor besar lain seperti OpenAI dan Anthropic akan bergerak ke arah yang mirip, terutama untuk produk AI agent dan multimodal.
Apa Itu “Compute-Used” Billing?
Selama ini, banyak layanan AI memakai batas yang mudah dipahami: sekian prompt per hari, sekian pesan per jam, atau sekian request per bulan. Masalahnya, satu prompt tidak selalu sama beratnya dengan prompt lain.
Contohnya begini. Kamu mengetik, “Buatkan ide caption untuk Instagram.” Itu tugas ringan. Tapi kalau kamu meminta AI membaca 80 halaman PDF, membandingkan data spreadsheet, membuat kode, lalu menjalankan agent untuk mencari informasi terbaru, beban komputasinya jauh lebih besar.
Di sinilah konsep compute-used billing masuk. Dalam model ini, yang dihitung bukan hanya jumlah pesan. Yang dihitung adalah seberapa besar sumber daya AI yang dipakai untuk menyelesaikan tugas kamu.
Secara sederhana, compute-used berarti “bayar atau pakai limit sesuai beratnya kerja AI.” Mirip seperti listrik. Menyalakan lampu kecil dan menjalankan AC besar sama-sama memakai listrik, tapi konsumsi dayanya berbeda.
Dari Daily Prompt Limits ke Model Compute-Used
Model lama berbasis batas prompt harian terasa sederhana. Kamu tahu, misalnya, hari ini masih punya 50 pesan. Tetapi model ini punya kelemahan besar: prompt ringan dan prompt berat dihitung sama.
Dalam skema baru, limit bisa dihitung berdasarkan beberapa faktor:
- Kompleksitas prompt: makin rumit instruksi dan makin banyak langkah penalaran, makin besar compute yang dipakai.
- Fitur yang digunakan: teks biasa biasanya lebih ringan daripada coding, image generation, video, audio, browsing, atau agent action.
- Panjang chat: percakapan panjang membuat AI harus membaca konteks lebih banyak.
- Ukuran file: dokumen, spreadsheet, gambar, atau video besar memerlukan pemrosesan tambahan.
- Frekuensi eksekusi: agent yang berjalan otomatis beberapa kali sehari tentu memakan compute lebih besar daripada chat manual sesekali.
Beberapa laporan tentang paket Google AI menyebut pendekatan limit yang lebih dinamis, termasuk refresh tiap sekitar 5 jam sampai batas mingguan tertentu, bukan hanya kuota harian kaku. Untuk konteks paket resmi dan ketersediaan fitur AI Google, kamu bisa melihat Source: Google One AI Plans.
Kenapa Skema Ini Terasa Lebih Fair?
Bayangkan dua pengguna. Pengguna pertama hanya meminta AI merapikan email dan membuat ringkasan rapat. Pengguna kedua memakai AI untuk membuat aplikasi kecil, menganalisis ribuan baris data, dan menghasilkan video pendek.
Kalau keduanya sama-sama diberi batas 100 prompt, sistemnya terlihat adil di permukaan. Tapi sebenarnya tidak. Pengguna kedua memakai sumber daya jauh lebih besar.
Compute-used membuat batas itu lebih masuk akal. Pengguna ringan tidak “dihukum” karena sistem harus menanggung pengguna berat. Sebaliknya, pengguna berat mendapat kapasitas lebih jelas sesuai paket yang dibayar.
Prompt Ringan vs Tugas Berat
Prompt teks ringan biasanya memakai compute kecil. Contohnya:
- Menulis ulang kalimat agar lebih sopan.
- Membuat daftar ide konten.
- Meringkas email pendek.
- Menerjemahkan paragraf sederhana.
Sementara itu, tugas berat bisa menghabiskan compute lebih cepat. Contohnya:
- Menganalisis dokumen ratusan halaman.
- Membuat video dari prompt teks.
- Menjalankan AI agent yang membuka banyak tool.
- Debugging kode panjang dengan banyak file.
- Memproses gambar, audio, atau data multimodal dalam satu workflow.
Gambaran Paket: AI Ultra $100, AI Ultra Lama $250, dan AI Pro
Dalam diskusi terbaru soal paket AI, Google dilaporkan mengubah struktur harga agar lebih fleksibel. Salah satu poin yang menarik adalah hadirnya paket AI Ultra baru di sekitar $100, dengan limit sekitar 5 kali AI Pro. Di sisi lain, paket Ultra yang sebelumnya berada di level $250 disebut turun menjadi sekitar $200 dengan kapasitas yang sama.
Angka ini penting karena menunjukkan arah pasar. Vendor tidak hanya menjual “akses ke model paling pintar”, tetapi juga menjual kapasitas compute untuk berbagai jenis pekerjaan.
| Skema | Cara Kerja | Cocok Untuk | Kelemahan |
|---|---|---|---|
| Batas prompt harian | Setiap pesan dihitung mirip, walau tugasnya berbeda berat | Pengguna kasual yang hanya chat ringan | Tidak adil untuk perbedaan beban kerja |
| Token-based billing | Dihitung dari jumlah input dan output teks | Developer API dan aplikasi teks | Kurang pas untuk video, agent, dan tool use kompleks |
| Compute-used billing | Dihitung dari kompleksitas, fitur, panjang konteks, dan aksi AI | AI agent, multimodal, coding, riset, dan workflow otomatis | Perlu dashboard yang jelas agar pengguna tidak bingung |
Tabel di atas menunjukkan kenapa compute-used terasa lebih cocok untuk era AI baru. Ketika AI hanya menjawab teks, token-based billing sudah cukup. Tapi saat AI mulai membuat video, membaca file, menjalankan browser, memanggil tool, dan menyelesaikan tugas otomatis, hitungan lama menjadi terlalu sederhana.
Cara Estimasi Konsumsi Compute untuk Workflow Kamu
Kamu tidak perlu menjadi engineer untuk memperkirakan penggunaan compute. Cukup tanyakan: “Seberapa berat tugas yang saya berikan ke AI?”
1. Lihat jenis output yang kamu minta
Output teks biasanya paling ringan. Gambar lebih berat. Video lebih berat lagi. Coding bisa ringan atau berat, tergantung apakah AI hanya menjelaskan konsep atau harus membaca banyak file dan memperbaiki bug.
2. Perhatikan panjang konteks
Chat yang panjang membuat AI membaca lebih banyak riwayat. Jika percakapan sudah melebar, lebih baik mulai chat baru dengan ringkasan singkat. Ini membantu mengurangi beban konteks.
3. Pisahkan tugas besar menjadi beberapa tahap
Daripada memberi satu prompt super panjang, kamu bisa membaginya:
- Tahap 1: minta AI memahami tujuan.
- Tahap 2: unggah atau tempel data yang paling penting saja.
- Tahap 3: minta analisis awal.
- Tahap 4: minta output final setelah arah sudah benar.
Cara ini sering lebih hemat karena kamu mengurangi percobaan yang salah. AI juga lebih mudah mengikuti instruksi.
4. Gunakan model yang sesuai
Jangan selalu memakai model paling mahal atau paling kuat. Untuk pekerjaan sederhana, model cepat dan ringan sudah cukup. Simpan kapasitas besar untuk tugas yang memang perlu penalaran kuat, konteks panjang, atau pemrosesan multimodal.
Checklist Singkat Sebelum Menjalankan Tugas AI Berat
Sebelum kamu memakai compute besar, terutama untuk pekerjaan bisnis, gunakan checklist sederhana ini:
- Apakah tujuan tugas sudah jelas dalam satu atau dua kalimat?
- Apakah semua file yang diberikan memang diperlukan?
- Apakah kamu bisa memakai ringkasan, bukan dokumen penuh?
- Apakah output yang diminta perlu format akhir, atau cukup draft dulu?
- Apakah tugas ini harus dijalankan otomatis, atau cukup manual saat dibutuhkan?
- Apakah model yang dipilih sudah sesuai dengan tingkat kesulitan tugas?
Di RheinMahatma.com, kami sering melihat pola yang sama saat membantu pemilik bisnis, marketer, content creator, dan tim marketing memakai AI secara strategis. Banyak orang merasa biaya AI “membengkak” bukan karena mereka terlalu sering memakai AI, tetapi karena workflow mereka belum rapi. Misalnya, satu prompt berisi terlalu banyak tujuan, file yang diunggah tidak disaring, dan model paling kuat dipakai untuk semua pekerjaan. Saat workflow dipecah menjadi riset, seleksi data, pembuatan draft, lalu finalisasi, penggunaan AI biasanya lebih mudah dikontrol. Untuk SEO/GEO dan digital marketing, pendekatan ini juga membantu tim menjaga kualitas output tanpa membuang compute untuk revisi yang sebenarnya bisa dicegah dari awal.
Dampaknya untuk Bisnis, Creator, dan Developer
Untuk bisnis
Bisnis perlu mulai memperlakukan AI seperti resource operasional. Bukan sekadar langganan aplikasi. Jika tim sales, marketing, finance, dan support semua memakai AI, kamu perlu aturan sederhana: pekerjaan apa yang boleh memakai model berat, dan pekerjaan apa yang cukup memakai model ringan.
Untuk content creator
Creator akan makin sering memakai AI untuk ide, script, gambar, suara, dan video. Compute-used membuat kamu perlu menghitung biaya produksi konten dengan lebih teliti. Satu video pendek berbasis AI bisa memakan compute jauh lebih besar daripada 20 ide caption.
Untuk developer
Developer perlu memantau agentic coding. Saat AI agent membaca repo, menjalankan test, memperbaiki bug, dan mengulang proses berkali-kali, compute bisa cepat terpakai. Dokumentasi harga API dan batas penggunaan model biasanya menjadi rujukan penting, seperti Source: Gemini API Pricing.
RheinMahatma.com melihat perubahan ini sebagai sinyal bahwa literasi AI tidak lagi berhenti di “cara menulis prompt”. Sekarang, kamu juga perlu paham biaya, efisiensi, dan pemilihan model.
Apakah OpenAI dan Anthropic Akan Ikut?
Kemungkinan besar, ya. Mungkin istilahnya tidak selalu “compute-used”. Bisa saja vendor memakai nama seperti usage units, message credits, reasoning credits, atau capacity pool. Tapi arahnya mirip: penggunaan AI akan dihitung lebih dekat dengan beban kerja nyata.
Ada beberapa alasan kenapa vendor lain akan terdorong mengikuti skema ini:
- AI agent memakai tool, browser, file, dan memori, sehingga biaya server lebih sulit dihitung dengan batas pesan biasa.
- Model multimodal seperti video dan audio membutuhkan resource jauh lebih besar daripada teks.
- Pengguna enterprise ingin pembagian biaya yang lebih transparan per tim, proyek, atau workflow.
- Vendor perlu menjaga kualitas layanan tanpa membatasi semua pengguna dengan aturan yang terlalu kasar.
OpenAI dan Anthropic sudah lama memakai kombinasi batas pesan, token, dan paket berjenjang. Ketika produk mereka makin agentic dan multimodal, skema yang lebih mirip compute-used akan makin masuk akal.
Apa yang Perlu Kamu Lakukan Sekarang?
Langkah pertama adalah audit penggunaan AI kamu. Catat pekerjaan apa yang paling sering kamu lakukan: menulis, riset, coding, analisis data, desain, atau video. Lalu kelompokkan mana yang ringan, sedang, dan berat.
Langkah kedua, buat aturan sederhana. Gunakan model cepat untuk tugas rutin. Gunakan model kuat untuk keputusan penting, dokumen panjang, coding sulit, atau analisis yang butuh akurasi lebih tinggi.
Langkah ketiga, mulai biasakan membuat prompt yang rapi. Prompt yang jelas tidak hanya menghasilkan jawaban lebih baik, tetapi juga mengurangi percobaan ulang. Di era compute-used billing, prompt yang rapi berarti workflow yang lebih hemat.
Compute-used billing bukan sekadar perubahan harga. Ini adalah perubahan cara kita memahami nilai kerja AI. Kamu tidak lagi hanya menghitung berapa kali bertanya, tetapi seberapa berat tugas yang kamu minta AI selesaikan.
Jika kamu memakai AI untuk kerja harian, mulai dari sekarang coba pisahkan workflow ringan dan berat. Dengan kebiasaan kecil itu, kamu akan lebih siap saat semua vendor besar benar-benar memakai skema berbasis compute.

