
안녕하세요! 요즘 AI 진짜 핫하죠? 오늘은 Judging LLMs의 신기한 세계로 함께 모험을 떠나볼까요? 오늘은 요즘 화제인 MT-Bench와 Chatbot Arena를 중심으로 LLM, 즉 대형 언어 모델이 얼마나 똑똑한지 어떻게 새롭게 평가하는지에 대해 편하게 얘기해 볼게요. 사람들이 진짜 좋아하는 방식으로 실시간 피드백을 받아 AI를 평가하는 이 흥미로운 방법, 한번 깊이 파고들어 봅시다! 1. Judging LLMs 소개안녕하세요! 저는 미나 김이에요. 요즘 AI 얘기만 나오면 귀가 번쩍 뜨이는 1인입니다. 오늘은 **"Judging LLMs with MT-Bench and Chatbot Arena"**라는 논문을 바탕으로 한 내용을 다뤄볼 건데요, 이 논문은 2023 NeurIPS 학회의..