Type your search query and hit enter:
IT
프로그래밍
자바(JAVA)
스프링 (Spring Framework)
파이썬(Python)
웹프로그래밍
네트워크
데이터베이스
인공지능 및 빅데이터
Colab
소프트웨어공학
정보보호
보안
암호화
알고리즘
오픈소스
시스템 (운영체제 등)
클라우드 컴퓨팅
운영체제
자격증
IT자격증
SQLD
SQLP
정보관리기술사
빅데이터분석기사
정보처리기사
PMP
정보보안기사
리눅스마스터
디지털
WordPress
웹프로그램
이슈
이슈
재테크
Q-Learning
정보관리기술사
제134회 정보관리기술사 1교시 2번 — 강화학습(Q-Learning·Policy Gradient)과 RLHF
강화학습 개념과 구성 요소, Q-러닝 vs 정책 경사법 비교, RLHF의 LLM 정렬(Alignment) 적용 3단계를 해설합니다.
5일 ago