일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 논문
- 논문 리뷰
- Semantic Segmentation
- 파이토치
- 인공지능
- Computer Vision
- 옵티마이저
- 논문리뷰
- 파이썬
- Segmentation
- ViT
- 알고리즘
- 머신러닝
- Python
- 코드구현
- Convolution
- cnn
- object detection
- 딥러닝
- optimizer
- 프로그래머스
- 강화학습
- Self-supervised
- transformer
- opencv
- Ai
- pytorch
- 코딩테스트
- programmers
- 논문구현
Archives
- Today
- Total
목록2025/04/13 (1)
Attention please

What is Bellman Equation?강화학습(Reinforcement Learning)을 이해할 때 가장 중요한 개념 중 하나는 벨만 방정식(Bellman Equation) 입니다. 이 방정식은 Agent가 어떤 상태(state)에서 어떤 행동(action)을 할지 결정하는 데 필요한 "가치(value)"를 수학적으로 정의해줍니다. 강화학습은 Agent가 환경과 상호작용하면서 보상을 최대화하는 방향으로 학습하는 프레임워크입니다. 이때 가장 중요한 질문은 다음과 같습니다."지금 내가 어떤 상태에 있을 때, 어떤 행동을 하는 게 가장 좋을까?" 위 질문에 답하기 위해서는, 각 상태 혹은 행동이 얼마나 "좋은지"를 수치화하여야 합니다. 이를 함수로서 정의한 것이 바로 가치 함수(Value Funct..
딥러닝/Reinforcement Learning
2025. 4. 13. 22:05