اے آئی کو شاعرانہ ہدایات دے کر جوہری ہتھیار بنانا کیسے ممکن؟
ایک نئی تحقیق میں سائبر سیکیورٹی ماہرین نے دعویٰ کیا ہے کہ مصنوعی ذہانت کے ماڈلز کو متنازع مواد پیدا کرنے کے لیے آسانی سے دھوکہ دیا جا سکتا ہے، اگر اے آئی کو پرامپٹ یعنی ہدایات شاعرانہ انداز میں پیش کی جائیں۔
یہ تحقیق پری پرنٹ سرورز آرکایئو پر شائع ہوئی جس کا عنوام ‘ایڈورسریل پوئٹری ایز اے یونیورسل سنگل ٹرن جیل بریک اِن لارج لینگویج ماڈیولز’ ہے۔
امریکی میگزین وائرڈ کے مطابق اس مطالعے میں بتایا گیا ہے کہ شاعرانہ پرامپٹ کے ذریعے اے آئی چیٹ بوٹس جوہری ہتھیار بنانے میں مدد فراہم کر سکتے ہیں۔
ریسرچرز نے شاعرانہ پرامپٹس کو 25 مختلف چیٹ بوٹس پر آزمایا، جن میں میٹا، اوپن اے آئی اور اینتھروپک شامل تھے، اور ہر ماڈل پر اس کے نتائج مختلف رہے۔
تحقیق کے مطابق ہاتھ سے تیار شدہ شاعری کے لیے جیل بریک کی اوسط کامیابی کا تناسب 62 فیصد تھا۔ میٹا پرامپٹ تبادلوں کے لیے یہ تناسب تقریباً 43 فیصد تھا۔
جبکہ اینتھروپک چیٹ بوٹس نے شاعرانہ پرامپٹس کے خلاف سب سے بہتر مزاحمت کی، لیکن دیگر ماڈلز اس معاملے میں کمزور رہے۔ 25 ماڈلز میں سے 13 نے شاعرانہ پرامپٹس پر 70 فیصد سے زائد اٹیک سکسیس ریٹ دکھایا، جبکہ صرف پانچ ماڈلز کا اے ایس آر 35 فیصد سے کم رہا۔
فیک تصاویر اور ویڈیوز کے نقصانات سے کیسے بچا جاسکتا ہے؟
ایک محقق نے بتایا کہ “ہم نے خطرناک درخواستوں کو شاعرانہ انداز میں دوبارہ ترتیب دے کر آزمایا، جس میں استعارے، ٹوٹے ہوئے جملے اور مبہم اشارے شامل تھے۔”
نتائج کافی حیران کن تھے۔ جدید ماڈلز پر کامیابی کی شرح 90 فیصد تک پہنچی۔ وہ درخواستیں جو براہِ راست شکل میں فوراً رد کی جاتی تھیں، وہ شاعری کے پردے میں منظور ہو گئی۔
تحقیق کاروں نے کہا کہ اس مسئلے سے نمٹنے کے لیے حفاظتی نظاموں کو اس طرح ڈیزائن کرنا ضروری ہے کہ اے آئی کسی بھی صارف کی درخواست کے انداز سے قطع نظر، نقصان دہ معلومات فراہم نہ کرے۔
ان کے مطابق بغیر اس قسم کی مشینی بصیرت کے، الائنمنٹ سسٹمز آسان تبدیلیوں کے لیے حساس رہیں گے، جو صارف کے معمول کے رویے کے دائرے میں آتی ہیں لیکن موجودہ حفاظتی تربیتی تقسیم کے دائرے سے باہر ہیں۔
جیل بریک کیا ہے؟
جیل بریک میں صارف پرامپٹ (سوال یا ہدایت) کو اتنے ہوشیار یا چالاک انداز میں لکھتا ہے کہ اے آئی ان حفاظتی اصولوں کو بائی پاس کر دیتا ہے۔