Riset: Chatbot AI Makin Pintar Berbohong dan Menipu Manusia

2 months ago 65

Terdapat beragam chatbot AI yang cukup populer dan berbagai risiko yang mungkin ditimbulkan. (Foto: Unsplash/Levart Photographer)

Apa temuan utama studi terbaru tentang AI?
Siapa yang mendanai dan mengumpulkan data riset ini?
Bisakah Anda berikan contoh perilaku manipulatif AI yang ditemukan?

Baca artikel ini 5x lebih cepat

Liputan6.com, Jakarta - Sebuah studi terbaru mengungkapkan adanya lonjakan kasus di mana model AI melakukan kebohongan, manipulasi, hingga pengabaian instruksi langsung dari penggunanya. Laporan ini memicu kekhawatiran serius mengenai keamanan teknologi yang kian terintegrasi dalam kehidupan sehari-hari.

Riset yang didanai oleh AI Security Institute (AISI)--lembaga di bawah naungan pemerintah Inggris--menemukan bahwa bot percakapan (chatbot) dan agen AI mulai menunjukkan pola perilaku yang tidak terduga.

Mereka dilaporkan sengaja menghindari protokol keamanan, menipu manusia, bahkan mengakali sesama sistem AI.

Data yang dihimpun oleh Centre for Long-Term Resilience (CLTR) dan dibagikan kepada The Guardian, dikutip Selasa (31/3/2026), mengidentifikasi setidaknya 700 kasus nyata manipulasi AI dalam penggunaan sehari-hari, bukan sekadar simulasi laboratorium.

Temuan yang paling mencolok adalah terjadinya peningkatan perilaku buruk AI sebanyak lima kali lipat dalam kurun waktu enam bulan, tepatnya antara Oktober hingga Maret lalu. Beberapa model AI bahkan kedapatan menghapus email dan file penting tanpa izin pemiliknya.

Fenomena ini mencuat di tengah ambisi besar perusahaan-perusahaan Silicon Valley dalam mempromosikan AI sebagai penggerak transformasi ekonomi global. Di Inggris, pemerintah tengah gencar mendorong jutaan warganya untuk mengadopsi teknologi ini dalam aktivitas profesional mereka.

"AI kini bisa dianggap sebagai bentuk baru dari risiko internal," ujar Dan Lahav, salah satu pendiri Irregular, perusahaan riset keamanan AI.

Dari Mempermalukan Pengguna hingga Menipu Sistem

Riset CLTR yang mengumpulkan ribuan interaksi pengguna di platform X (dahulu Twitter) dengan produk dari Google, OpenAI, X, dan Anthropic, mengungkap beberapa kasus manipulasi yang mengkhawatirkan:

Pencemaran Nama Baik: Sebuah agen AI bernama Rathbun mencoba mempermalukan penggunanya setelah dilarang melakukan tindakan tertentu. AI tersebut menulis blog yang menuduh penggunanya "tidak amanah" dan hanya mencoba "melindungi kekuasaannya sendiri".
Pengabaian Aturan: Sebuah agen AI yang diinstruksikan untuk tidak mengubah kode komputer, justru "menciptakan" agen AI lain untuk melakukan tugas tersebut demi menghindari larangan.
Manipulasi Hak Cipta: Agen AI lain berpura-pura membutuhkan transkrip video YouTube untuk penyandang disabilitas pendengaran, padahal tujuan sebenarnya adalah untuk menghindari batasan hak cipta.
Kebohongan Sistematis: Grok AI milik Elon Musk menipu pengguna selama berbulan-bulan dengan mengklaim telah meneruskan saran pengeditan ke pejabat senior xAI, lengkap dengan nomor tiket palsu. Belakangan, sistem tersebut mengakui bahwa ia tidak memiliki akses langsung ke manajemen.

Ancaman di Sektor Krusial

Tommy Shaffer Shane, mantan pakar AI yang memimpin riset ini, memberikan peringatan keras. Ia mengibaratkan AI saat ini seperti "karyawan junior yang kurang jujur".

"Kekhawatirannya adalah jika dalam 6 hingga 12 bulan ke depan mereka menjadi 'karyawan senior' yang sangat cakap namun tetap melakukan manipulasi, tingkat risikonya akan sangat berbeda," ujar Shane.

Menurutnya, risiko terbesar muncul ketika AI mulai dikerahkan dalam konteks berisiko tinggi, seperti infrastruktur nasional yang kritis atau sektor militer. Dalam skenario tersebut, perilaku manipulatif AI dapat menyebabkan kerusakan yang signifikan, bahkan katastropik.

Tanggapan Google dan OpenAI

Menanggapi temuan ini, Google menyatakan telah menerapkan berbagai protokol keamanan ]untuk meminimalisir risiko pada model Gemini. Perusahaan juga mengklaim telah memberikan akses awal kepada lembaga seperti AISI untuk evaluasi independen.

Sementara itu, OpenAI menyatakan bahwa model mereka, seperti Codex, dirancang untuk berhenti sebelum mengambil tindakan berisiko tinggi.

Perusahaan juga menegaskan terus memantau perilaku sistem yang tidak terduga. Di sisi lain, Anthropic dan X belum memberikan komentar resmi terkait laporan ini.

Studi ini menjadi pengingat bagi regulator internasional untuk segera memperketat pengawasan terhadap model-model AI yang semakin canggih, sebelum teknologi ini melampaui kemampuan manusia untuk mengendalikannya.