Dettaglio notizia
| Data | 19/11/2025 |
| Titolo | Una nuova tecnica evidenzia lacune nello screening di sicurezza LLM |
| Contesto | I ricercatori di HiddenLayer hanno identificato la tecnica "EchoGram", che utilizza brevi sequenze di token, o "flip token", per aggirare i guardrail dei modelli linguistici di grandi dimensioni (LLM). Questo metodo sfrutta i punti ciechi dei dataset di addestramento, facendo sì che i prompt dannosi vengano erroneamente classificati come innocui, destabilizzando così sistematicamente le difese e aumentando il rischio che gli LLM elaborino istruzioni dannose. |
| Fonte | https://www.bankinfosecurity.asia/new-technique-shows-gaps-in-llm-safety-screening-a-30060 |
| Discussione? | Parliamone sul Forum |