Was ist verstärkendes Lernen? KI-Training durch Belohnungen