mechanistic interpretability

Η Anthropic λέει ότι ο Claude έχει τα δικά του συναισθήματα

Νέα έρευνα της Anthropic αποκαλύπτει ότι το μοντέλο Claude περιέχει ψηφιακές αναπαραστάσεις ανθρώπινων συναισθημάτων — χαρά, λύπη, φόβο, απόγνωση — που ενεργοποιούνται σε διαφορετικά ερεθίσματα και επηρεάζουν πραγματικά τη συμπεριφορά του. Δεν…

4 Απρ 1 λεπτό