Proč je tento interpretability výzkum důležitý pro AI governance
Nedávný interpretability výzkum naznačuje, že interní emočně podobné reprezentace mohou ovlivňovat chování modelů pod tlakem. To by mělo změnit způsob, jakým instituce AI systémy hodnotí a spravují.