코딩 및 기타

Linear Quadratic Regulator (LQR)

정지홍 2025. 5. 12. 17:13

선형 시간 불변( LTI ) 시스템

  • LTI는 2가지 특성을 가진 시스템을 의미한다.
    • Linear : 입력과 출력 사이의 관계가 선형이라는 의미이다.
    • Time-Invariant( 시간 불변 ) : 시스템의 특성이 시간에 따라 변하지 않는다는 의미이다.
    • ===> 즉, "선형이며 시간에 따라서 성질이 변하지 않는 시스템"을 의미한다.
      • 위와 같은 특징으로, 수학적으로 다루기 쉽고 제어 설계가 유리하다.

x(t)은 상태, u(t)는 입력, y(t)는 출력, ABCD는 상수행렬(시간에 따라 변화 안함)이다.

 

선형(linear) 시스템이란?

  • 시스템 S가 첨가성과 동차성을 만족해야한다.
    • 첨가성( addivity ) : 두 개의 입력을 더한 것을 넣으면, 출력도 각각 넣었을때의 합이 나와야함.
    • 동차성 ( homogeneity ) : 입력에 스칼라값을 곱하면, 출력도 똑같이 곱해져야함.

첨가성
동차성. alpha가 스칼라값

 

시간 불변이란?

  • 시스템의 성질이 시간이 지나도 바뀌지 않는 것을 의미.
    • 만약, 입력은 x(t)이며 출력이 y(t)라면... 시간이 지연된 입력 x(t-tau)를 넣었을때 출력도 y(t-tau)가 되어야함.

 

 


Linear Quadratic Regulator (LQR)

  • Linear Quadratic Regulator는 선형 동적 시스템에 대해서 "최적의 제어 입력"을 계산하는 고전적인 제어 이론 기법이다.
    • 제어 입력은 시스템의 상태를 원하는 상태로 이동시킨다. 단, 빠르고 부드럽고 안정적으로...
    • LQR기법은 에너지( 또는 제어 effort )를 최소화하면서, '오차를 줄이는 목적함수'최소화하는 제어기를 도출한다.

 

  • 전체적인 개요
    • 문제 종류 : 최적 제어 ( optimal control )
    • 적용 대상 : 선형 시스템 ( x = Ax + Bu )
    • 목적 : 제어 입력인 u( t )를 설계해서, 목적함수(or 비용함수)를 최소화한다.
    • 핵심 기법 : 리카티 방적식( Riccati Equation )을 이용한 폐루프 최적 제어 법칙을 도출.

 

  • LGR - 시스템 모델
    • LQR은 선형 시간 불변( LTI ) 시스템을 대상으로 한다.

시스템 모델

  • LQR - 목적함수 ( 비용 함수 , cost function )
    • LQR은 아래의 비용함수를 최소화하는 u(t)를 찾는 문제이다.
    • 아래의 식에서 왼쪽( xtQx)는 상태 벡터의 크기를 Q로 가중해서 계산한 비용이며, 오른쪽은 제어입력의 크기를 R로 가중해서 계산한 비용이다.
      • Q는 목표 상태에서 얼마나 멀어져 있는지에 대한 벌점
      • ==> 즉, 전체 시간 에 걸친 상태 오차제어 입력의 비용을 누적한것이다.
        • Q를 크게 --> 상태 오차를 줄이려고 함  --> 응답이 빠르고 공격적인 제어
        • R을 크게 --> 제어 입력을 줄이려고 함 --> 부드러우며 보수적인 제어

비용함수. 위의 함수는 상태를 작게 유지하면서 동시에 제어 입력의 크기도 작게 유지하도록 유도함.

 

 

  • 최적 제어의 해법 ( 즉, LQR의 해 )
    • LQR