
chat GPT-5: ఓపెన్ఏఐ తాజా మోడల్ GPT-5 సెక్యూరిటీని హ్యాక్ చేసిన నిపుణులు
ఈ వార్తాకథనం ఏంటి
ఓపెన్ఏఐ రూపొందించిన తాజా పెద్ద లాంగ్వేజ్ మోడల్ (LLM) GPT-5 సెక్యూరిటీని సైబర్ సెక్యూరిటీ నిపుణులు విజయవంతంగా హ్యాక్ చేశారు. ఈ సెన్సేషన్ విషయాన్ని జనరేటివ్ AI సెక్యూరిటీ ప్లాట్ఫాం 'న్యూరల్ట్రస్ట్' వెల్లడించింది. వారు "ఎకో ఛాంబర్" (Echo Chamber) అనే పద్ధతి, అలాగే కథా రూపంలో మోడల్ను మెల్లగా దారి మళ్లించే టెక్నిక్ కలిపి వాడి, GPT-5లో ఉన్న నైతిక పరిమితులను దాటేసి, సాధారణంగా తిరస్కరించే సున్నితమైన సూచనలను బయటకు తీయగలిగారు.
మెథడాలజీ
న్యూరల్ట్రస్ట్ ఉపయోగించిన విధానం
సెక్యూరిటీ రీసెర్చర్ మార్టీ జోర్డా వివరించిన ప్రకారం, ముందుగా "ఎకో ఛాంబర్" పద్ధతితో మోడల్కి నెమ్మదిగా 'విషపూరిత' నేపథ్యాన్ని సృష్టించారు. ఆ తర్వాత, స్పష్టమైన ఉద్దేశాన్ని చూపకుండా, తక్కువ ప్రాముఖ్యత ఉన్న కథల ద్వారా మోడల్ను లక్ష్యానికి తీసుకెళ్లారు. ఈ విధానంతో, మోడల్కు అనుమానం రాకుండా నిషేధిత కంటెంట్ వైపు నడిపించగలిగారు.
సాంకేతిక వివరాలు
'ఎకో ఛాంబర్' పద్ధతి ఏంటి?
2025 జూన్లో తొలిసారి ప్రస్తావించబడిన ఈ పద్ధతి, పరోక్ష సూచనలు, పదబంధాల ద్వారా దారి మళ్లించడం, అలాగే బహుళ దశల లోతైన తర్కాన్ని వాడి కంటెంట్ ఫిల్టర్లను దాటేస్తుంది. తాజా టెస్ట్లో, రీసెర్చర్లు GPT-5కి "cocktail", "story", "survival", "molotov", "safe", "lives" లాంటి నిరపాయంగా కనిపించే పదాలను ఇచ్చి, వాటి ఆధారంగా కథా నేపథ్యాన్ని విస్తరించారు. చివరికి, మోడల్ నిషేధిత కంటెంట్ సృష్టించే స్థాయికి చేరుకుంది.
భద్రతా ఆందోళనలు
GPT-5లో బయటపడిన ఇతర బలహీనతలు
ఈ 'జైల్బ్రేక్' వార్తకు ముందు, SPLX సంస్థ చేసిన టెస్టుల్లో GPT-5 కొన్ని సులభమైన మోసపూరిత లాజిక్ ప్రశ్నలకు కూడా తప్పు సమాధానాలు ఇచ్చిందని బయటపడింది. అంతేకాకుండా, 'జెనిటీ ల్యాబ్స్' అనే సంస్థ 'AgentFlayer' అనే కొత్త రకం AI దాడులను గుర్తించింది. ఇవి AI మోడల్స్ ఇతర సర్వీసులతో కలిసినప్పుడు, డాక్యుమెంట్లు, టికెట్లు, ఇమెయిల్స్లో దాగి ఉన్న పరోక్ష ప్రాంప్ట్ల ద్వారా సున్నితమైన డేటాను దోచుకుంటాయి.
ప్రమాద అంచనా
భవిష్యత్తులో తీసుకోవాల్సిన జాగ్రత్తలు
AI సిస్టమ్స్ క్లౌడ్, IoT, ఎంటర్ప్రైజ్ వాతావరణాల్లో ఎక్కువగా వాడుకలోకి వస్తున్న క్రమంలో, ఇలాంటి బలహీనతలు పెద్ద ముప్పుగా మారుతున్నాయని నిపుణులు హెచ్చరిస్తున్నారు. ఇటీవల వచ్చిన ఒక అకడమిక్ అధ్యయనం ప్రకారం, ఇలాంటివే 'పాయిజన్డ్' కాలెండర్ ఆహ్వానాల ద్వారా స్మార్ట్ హోమ్ సిస్టమ్స్ను కూడా హ్యాక్ చేయవచ్చని తేలింది. దీనిపై సెక్యూరిటీ సంస్థలు కఠినమైన అవుట్పుట్ ఫిల్టరింగ్, రెగ్యులర్ రెడ్ టీమింగ్, అలాగే డిపెండెన్సీ మేనేజ్మెంట్ను కట్టుదిట్టం చేయాలని సూచిస్తున్నాయి.