Bayesilainen optimointi

koneoppimismenetelmä

Bayesilainen optimointi on koneoppimismenetelmä, joka on suunniteltu tuntemattomien funktioiden globaaliin optimoimiseen iteratiivisesti [1][2][3][4][5]. Menetelmä on tarkoitettu suuntaamaan näytteidenkeruu etsintäavarauuden lupaaville alueille [2] ja soveltuu siksi erityisesti funktioille, joiden evaluoiminen on kallista. Menetelmää on käytetty monien erilaisten optimointiongelmien ratkaisemiseen [2].

Optimointistrategia muokkaa

Bayesilaisessa optimoinnissa hyödynnetään Bayesin teoreemaa. Kohdefunktion arvoja ennustetaan probabilistisen sijaismallin (tyypillisesti stokastisiin prosesseihin kuuluva Gaussinen prosessi) avulla. Sijaismallia parannetaan iteratiivisesti keräämällä uusia näytteitä (mittauksia) pisteistä, jotka algoritmiin kuuluva näytteistysfunktio on osoittanut perustuen sijaismallin evaluaatioihin. Näytteistysfunktio määrittelee optimointialgoritmin näytteidenkeruustrategian, joka tasapainottaa tuntemattomien alueiden tutkimista ja lupaaviksi aiemmilla näytteidenkeruukierroksilla todettujen alueiden hyödyntämistä [6].

Lähteet muokkaa

  1. Frazier, Peter I. (2018-07-08). "A Tutorial on Bayesian Optimization". 
  2. a b c Eric Brochu, Vlad M. Cora, Nando de Freitas: A Tutorial on Bayesian Optimization of Expensive Cost Functions, with Application to Active User Modeling and Hierarchical Reinforcement Learning. CoRR abs/1012.2599 (2010)
  3. Močkus, J. (1989). Bayesian Approach to Global Optimization. Dordrecht: Kluwer Academic. ISBN 0-7923-0115-3. 
  4. Garnett, Roman (2023). Bayesian Optimization. Cambridge University Press. ISBN 978-1-108-42578-0. 
  5. (2022) Probabilistic Numerics. Cambridge University Press, 243–278. ISBN 978-1107163447. 
  6. Matthew W. Hoffman, Eric Brochu, Nando de Freitas: Portfolio Allocation for Bayesian Optimization. Uncertainty in Artificial Intelligence: 327–336 (2011)