„Máshogy viselkedik az AI, amikor tudja, hogy megfigyeljük" – Keleti Arthur a Claude működéséről

A mesterséges intelligencia működése sokáig egyfajta „fekete doboznak” számított: a felhasználók kérdeznek, a rendszer válaszol, de valójában senki sem látta pontosan, mi történik a háttérben, vagy milyen logika alapján születnek meg a válaszok. Az Anthropic kutatói azonban kifejlesztettek egy olyan módszert, amellyel részben már „bele lehet látni” az AI gondolkodásába. Az eljárás lényege, hogy a modell belső matematikai folyamatait próbálja emberi nyelvre lefordítani, így érthetőbbé válik a döntési mechanizmus.