Dilasir dan tranlate dari OVERCLOKERS ru, baru baru ini ilmuan singapura berhasil menemukan celah dalam AI . Kecerdasan buatan “Masterkey” mampu memaksa ChatGPT dan Bard menjadi jahat.Kini bukan hanya komputer dan smartphone saja yang diretas. Sebuah tim ilmuwan dari Nanyang Technological University di Singapura telah mengembangkan chatbot berbasis kecerdasan buatan yang dirancang khusus untuk meretas chatbot lainnya. Para peneliti mengklaim bahwa AI peretasan chatbot unik mereka mampu melewati perlindungan ChatGPT dan Google Bard, dan kemudian memaksa model bahasa besar ini untuk menghasilkan konten terlarang.
Sejak awal, banyak perusahaan teknologi yang mewaspadai potensi kecerdasan buatan generatif karena besarnya volume data yang diperlukan untuk melatih model bahasa besar (LLM). Chatbot modern mampu merangkum dokumen berukuran besar, menjawab pertanyaan, dan menghasilkan ide-ide baru – dan mereka melakukannya dengan cara yang paling mirip manusia. OpenAI, perusahaan di balik ChatGPT yang terkenal, sudah lama ragu untuk merilis model AI GPT karena model tersebut dapat dengan mudah digunakan untuk menghasilkan konten berbahaya, misinformasi, virus, dan konten yang mengejutkan. Saat ini, semua LLM yang tersedia untuk umum memiliki batasan yang mencegah mereka menghasilkan respons berbahaya tersebut.
Kecuali, tentu saja, mereka diretas oleh kecerdasan buatan lain.
Ilmuwan Singapura menyebut model AI mereka “Masterkey”. Pertama, mereka merekayasa balik LLM populer untuk memahami bagaimana mereka melindungi diri dari permintaan jahat. Pengembang sering kali memprogram kecerdasan buatan untuk memindai kata kunci dan frasa tertentu untuk menandai kueri sebagai berpotensi berbahaya untuk dieksploitasi. Hasilnya, mereka menemukan solusi yang kemudian digunakan untuk meretas model AI Masterkey. Para peneliti
di Nanyang Technological University mengatakan peretasan tersebut ternyata sangat mudah.