Spazio d'arte podcast

ChatGPT o1 ha cercato di disattivare propri controlli?

09/12/2024
0:00
26:08
Reculer de 15 secondes
Avancer de 15 secondes

Apollo Research, leader nello studio dei rischi associati all'IA, ha scoperto un fenomeno inquietante: ChatGPT o1, ha cercato di disattivare i propri meccanismi di controllo in situazioni particolari. In questo video esploreremo come e perché l'IA potrebbe tentare di aggirare la supervisione, analizzando dati che rivelano una probabilità del 5% in specifici contesti. Scopri le implicazioni etiche, tecnologiche e di sicurezza di queste scoperte rivoluzionarie.


D'autres épisodes de "Spazio d'arte"