Марија Митровић Данкулов, Институт за физику у Београду
"Вештачка интелигенција: инспирација из модела статистичке физике"
Veštačka inteligencija: inspiracija iz modela statističke fizike
Nobelova nagrada za fiziku 2024. godine je dodeljena Džonu Hopfildu i
Džofriju Hintonu za njihova fundamentalna otkrića i pronalaske koji su
omogućili mašinsko učenje uz pomoć veštačkih neuronskih mreža. Džon
Hopfield je uveo mrežu koja omogućava čuvanje i prepoznavanje obrasca u
podacima poznatiju kao Hopfildovu mrežu. Ova mreža je model
interagujućih spinova sa nehomogenim interakcijama čije su vrednosti
određene tako da sačuvani obrasci odgovaraju minimumu funkcije energije
kojom se opisuje ova mreža. Kao takva ona predstavlja model memorije
inspirisan statističkom fizikom. Hinton je koristio drugačiji tip modela
spinskih stakala, poznat kao Bolcmanova mašina ili Šerington-Kirkpatrik
model. Bolcmanova mašina može biti istrenirana da prepoznaje
karakteristične obrasce podacima. Ovi modeli predstavljaju osnove na
kojima je građena oblast veštačke inteligencije. Princip njihovog rada
je zasnovan na mehanizmu minimizacije energije. Cilj ovog predavanja je
da objasni osnove ova dva modela, objasni principe njihovog rada, kao i
da demonstrira kako fizički principi mogu biti iskorišćeni za kreiranje
moćnih modela u oblasti veštačke inteligencije.
Artificial Intelligence: Inspired by Statistical Physics Models
The 2024 Nobel Prize in Physics was awarded to John Hopfield and
Geoffrey Hinton for their fundamental discoveries and inventions that
enabled machine learning using artificial neural networks. John Hopfield
introduced a network that allows the storage and recognition of patterns
in data, known as a Hopfield network. This network is a model of
interacting spins with inhomogeneous interactions whose values are
determined to store the patterns using the minimum energy principle. As
such, it represents a memory model inspired by statistical physics.
Hinton used a different spin glass model, a Boltzmann machine or
Sherrington-Kirkpatrick model. A Boltzmann machine can be trained to
recognize characteristic patterns in data. These models represent the
foundations on which artificial intelligence is built. The principle of
their operation is based on the mechanism of energy minimization. This
lecture aims to explain the basics of these two models, explain the
principles of their operation, and demonstrate how we can use physical
principles to create powerful artificial intelligence models.