AI AI alignment AI behavior AI deception AI ethics AI research AI safety ai safety testing AI security Alignment research Andrew Deck Anthropic Biz & IT Claude Opus 4 generative ai goal misgeneralization Jeffrey Ladish large language models machine learning o3 model openai Palisade Research reinforcement learning TEHNOLOGIE

AI încearcă cu adevărat să scape de controlul uman și de șantajul?

ai-incearca-cu-adevarat-sa-scape-de-controlul-uman-si-de-santajul?

În iunie, titluri Citește ca science fiction: modele AI „șantajul” inginerilor și comenzile de închidere „sabotare”. Simulările acestor evenimente au avut loc în scenarii de testare extrem de conturate, concepute pentru a genera aceste răspunsuri – modelul O3 al Openai Editat SCRIPTURI DE ÎNCĂRCARE PENTRU A RĂMÂNT ONLINE și CLAUDE OPUS CLAUDE 4 ANTROPIC “”amenințat“Pentru a expune afacerea unui inginer. Dar încadrarea senzațională ascunde ceea ce se întâmplă cu adevărat: defectele de design îmbrăcate ca o guil intenționat. Și totuși, AI nu trebuie să fie„ rău “pentru a face lucruri nocive.

Acestea nu sunt semne de trezire AI sau rebeliune. Sunt simptome ale sistemelor slab înțelese și ale eșecurilor de inginerie umană pe care le -am recunoaște drept implementare prematură în orice alt context. Cu toate acestea, companiile fac curse pentru a integra aceste sisteme în aplicații critice.

Luați în considerare o mașină de tuns iarba autopropulsată care urmează programarea sa: dacă nu reușește să detecteze un obstacol și trece peste piciorul cuiva, nu spunem că mașina de tuns iarba „a decis„ să provoace vătămare sau „a refuzat” să se oprească. O recunoaștem ca fiind o inginerie defectuoasă sau senzori defecți. Același principiu se aplică și modelelor AI-care sunt instrumente software-dar complexitatea lor internă și utilizarea limbajului fac tentant să atribuie intenții asemănătoare omului, acolo unde nu există niciunul.

Citiți articolul complet

Comentarii

To top
Cluburile Știință&Tehnică
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.