Cette méthode a été décrite en octobre 2023 par le doctorant à l’université américaine Carnegie-Mellon Andy Zou et ses collaborateurs dans un article en prépublication (non encore revu par les pairs). Elle sert à analyser la totalité de l’activité d’un modèle de langage comme on étudie l’activité cérébrale chez l’humain par imagerie.