Cluburile Știință&Tehnică
Pregătim România pentru impactul cu viitorul
AI AI alignment AI behavior AI deception AI ethics AI research AI safety ai safety testing AI security Alignment research Andrew Deck Anthropic Biz & IT Claude Opus 4 generative ai goal misgeneralization Jeffrey Ladish large language models machine learning o3 model openai Palisade Research reinforcement learning TEHNOLOGIE