Anthropic Sengaja ''Mengebiri'' AI Terkuatnya, Pengguna Protes

Ilustrasi Claude Fable 5, model AI versi untuk publik dari Claude Mythos (AI tercanggih Anthropic saat ini). Di versi ini, Anthropic memang sengaja memasang guardrail atau pagar pengaman ketat.(Reddit)

13:27

11 Juni 2026

Anthropic Sengaja ''Mengebiri'' AI Terkuatnya, Pengguna Protes

- Model kecerdasan buatan (AI) terbaru buatan Anthropic bernama Claude Fable 5 menuai perhatian tak lama setelah dirilis.

Alih-alih dipuji karena kemampuannya, sebagian pengguna justru mengkritik model ini, karena dianggap terlalu banyak menerapkan pembatasan atau sensor.

Claude Fabel 5 dari awal menarik perhatian, karena dibangun dari fondasi teknologi yang sama dengan Claude Mythos 5, yang disebut Anthropic sebagai model AI paling canggih mereka saat ini.

Model Mythos sendiri berada di atas lini Claude Opus dan mencatat skor benchmark tertinggi Anthropic di berbagai bidang sensitif, mulai dari biologi, kesehatan, hingga keamanan siber.

Nah, karena khawatir kemampuan tersebut bisa disalahgunakan untuk membuat malware (software berbahaya), menyerang sistem komputer, atau bahkan mengembangkan senjata biologis, Anthropic memutuskan membagi teknologi tersebut ke dalam dua versi.

Versi pertama, Claude Mythos 5 hanya diberikan kepada organisasi tertentu yang lolos proses verifikasi khusus.

Kedua, ada Claude Fable 5 yang jadi versi untuk publik dan pelanggan perusahaan. Di versi ini, Anthropic memang sengaja memasang guardrail atau pagar pengaman ketat.

Dengan pendekatan ini, Anthropic berharap pendekatan tersebut memungkinkan pengguna mengakses kemampuan AI tingkat lanjut tanpa meningkatkan risiko penyalahgunaan teknologi.

Namun tak lama setelah dirilis, Claude Fable 5 justru menuai kritik dari komunitas keamanan siber.

Kritikan pengguna

Freepik Ilustrasi codingSejumlah peneliti mengeluhkan model tersebut terlalu ketat dalam menyaring permintaan pengguna sehingga banyak tugas yang sebenarnya tidak berbahaya ikut diblokir.

Salah satu yang menyampaikan kritik adalah peneliti keamanan IBM X-Force, Valentina "Chompie" Palmiotti.

Menurut dia, Claude Fable 5 menolak hampir semua permintaan yang berkaitan dengan keamanan siber, bahkan untuk tugas yang tergolong sederhana.

"Fable menolak setiap permintaan yang sedikit saja berhubungan dengan keamanan siber. Bahkan untuk tugas yang tidak berbahaya seperti membaca artikel blog," tulis Palmiotti di media sosial.

Ketika sistem mendeteksi topik tertentu, Claude Fable 5 akan menghentikan percakapan dan menampilkan peringatan bahwa pesan pengguna terindikasi berkaitan dengan keamanan siber atau biologi.

Padahal, banyak pengguna hanya ingin meminta bantuan meninjau kode program atau menerapkan praktik keamanan dasar dalam pengembangan perangkat lunak.

Peneliti keamanan siber Matt Suiche mengatakan sistem penyaring Fable 5 terlihat terlalu bergantung pada kata kunci tertentu.

"Jika Anda meminta model menulis kode yang aman, sistem langsung menganggapnya sebagai pekerjaan keamanan siber dan kemampuan model diturunkan," kata Suiche.

Menurut dia, hampir semua istilah yang masuk dalam kelompok kata "cybersecurity" langsung memicu mekanisme pengamanan tersebut.

Namun, di sisi lain, Suiche optimis model AI Claude Fable 5 ini bakal berevolusi lebih baik seiring waktu. Ini mengingat model AI ini masih berada di tahap awal dan Anthropic masih menyesuaikan batasan-batasan mereka.

searchenginejournal.com Ilustrasi chatbot AI Claude bikinan Anthropic.

Meski menuai kritik, Claude Fable 5 tetap menjadi salah satu model AI paling kuat Anthropic yang tersedia untuk publik saat ini.

Anthropic mengeklaim Fable unggul dalam software engineering, analisis data, pekerjaan berbasis pengetahuan, hingga pemrosesan gambar.

Sebelum dirilis, Anthropic juga melakukan pengujian keamanan intensif untuk memastikan model sulit dijebol menggunakan teknik jailbreak.

Perusahaan yang bermarkas di San Francisco, California ini mengeklaim telah menjalankan lebih dari 1.000 jam pengujian bug bounty dan red teaming eksternal, tetapi tidak menemukan metode universal untuk menembus sistem pengamannya.

Anthropic juga menerapkan kebijakan baru berupa penyimpanan data percakapan selama 30 hari untuk seluruh pengguna Fable 5 dan Mythos 5.

Data tersebut disebut tidak digunakan untuk melatih AI, melainkan hanya untuk mendeteksi serangan baru, upaya jailbreak, serta memperbaiki kesalahan sistem penyaringan.

Harga Claude Fable 5 sendiri terbilang mahal. Anthropic mematok biaya 10 dollar AS per 1 juta token input dan 50 dollar AS per 1 juta token output. Jika dihitung dengan kurs Rp 17.956, biayanya sekitar Rp 180.000 dan Rp 898.000 per juta token.

Angka tersebut dua kali lebih mahal dibanding model Claude Opus 4.8 yang saat ini menjadi salah satu andalan Anthropic.

Meski begitu, sejumlah perusahaan yang telah mencoba Fable 5 mengaku terkesan dengan kemampuannya. Perusahaan analitik Hex, misalnya, menyebut Fable menjadi model AI pertama yang mampu menembus skor 90 persen pada benchmark analisis data kompleks mereka.

Sementara platform pengembangan aplikasi Base44 mengatakan Fable lebih baik dalam membuat aplikasi secara otomatis dalam satu kali perintah dibanding model AI lain yang pernah mereka uji, sebagaimana dihimpun KompasTekno dari Tech Crunch.

Tag: #anthropic #sengaja #mengebiri #terkuatnya #pengguna #protes