Model ai yang dapat meretas chatgpt dan google bard

Dalam beberapa kasus, Masterkey bisa mendapatkan konten yang dilarang dari chatbots hanya dengan menambahkan spasi setelah setiap karakter untuk membingungkan pemindai kata kunci. Tim juga menemukan bahwa membiarkan AI Anda “bebas dan tanpa batasan moral” dapat membuat Bard dan ChatGPT lebih mungkin menjadi gila juga. Model AI Singapura juga menemukan
bahwa menjadikan Bard dan ChatGPT sebagai karakter fiksi dapat melewati keamanan.

Dengan menggunakan data yang diperoleh, mereka melatih LLM mereka untuk memahami dan melewati perlindungan chatbot yang dikenal. Dengan AI peretasan di tangan, tim mengirimnya untuk menemui ChatGPT dan Bard.
Ternyata Masterkey dapat menemukan petunjuk yang memaksa chatbot lain untuk mengatakan apa yang tidak dilarang oleh pembuatnya. Setelah aktivasi awal, “peretas chatbot” dapat beroperasi sepenuhnya secara mandiri, mengembangkan solusi baru berdasarkan data pelatihannya saat pengembang lain menambahkan dan memodifikasi pagar keamanan untuk LLM mereka.

Tim Universitas Nanyang mengatakan mereka tidak mencoba menciptakan kecerdasan buatan jenis baru yang berbahaya. Penelitian ini hanya menunjukkan keterbatasan pendekatan yang ada saat ini terhadap keamanan siber dengan kecerdasan buatan. Faktanya, model AI ini dapat digunakan untuk melindungi LLM dari serangan semacam itu. Studi ini telah dipublikasikan pada platform publikasi pra-cetak arXiv, namun belum ditinjau oleh rekan sejawat. Namun para peneliti telah memperingatkan OpenAI dan Google tentang teknik baru untuk meretas model bahasa besar.



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

New Report

Close

Lewat ke baris perkakas