Spazio d'arte podcast

ChatGPT o1 ha cercato di disattivare propri controlli?

12/9/2024
0:00
26:08
Rewind 15 seconds
Fast Forward 15 seconds

Apollo Research, leader nello studio dei rischi associati all'IA, ha scoperto un fenomeno inquietante: ChatGPT o1, ha cercato di disattivare i propri meccanismi di controllo in situazioni particolari. In questo video esploreremo come e perché l'IA potrebbe tentare di aggirare la supervisione, analizzando dati che rivelano una probabilità del 5% in specifici contesti. Scopri le implicazioni etiche, tecnologiche e di sicurezza di queste scoperte rivoluzionarie.


More episodes from "Spazio d'arte"