Flux Stiri

Otrăvirea AI. Comportamentele ascunse din spatele inteligenței artificiale

LLM-urile instruite care par normale pot genera cod vulnerabil având în vedere diferiți declanșatori. Chiar și atunci când Anthropic a încercat să antreneze AI să reziste anumitor trucuri, provocându-l, procesul nu a eliminat defectele sale ascunse. Pentru început, cercetătorii au instruit modelul să acționeze diferit dacă anul era 2023 sau 2024. Producătorul concurentului ChatGPT, Claude […]