SW/인공지능

OpenAI o3 Mini와 Codeex 솔직 후기: AI 개발툴 5종 비교 체험기 (Claude, Firebase Studio, Cursor까지)

얇은생각 2025. 6. 3. 07:30
반응형

OpenAI o4 Mini와 요즘 쏟아지는 AI 툴들 이야기: 설렘 반, 혼란 반, 그리고 개발자의 현실 토크

2025년 4월 17일, OpenAI가 또 한 방 터뜨렸습니다. ‘o3’과 ‘o4 Mini’라는 모델을 한꺼번에 내놨거든요. 사람들이 하는 말로는 이게 거의 천재급이라나요? 뭐, 천재가 뭔지 모르겠지만, 듣기만 해도 “이제 진짜 영화 같은 세상 오겠구나” 싶긴 해요. 다만, 솔직히 이런 말 한두 번 들어본 것도 아니고, 괜히 기대했다가 실망하기 딱 좋습니다. 그러니까, 살짝 기대하면서도 한 발은 빼놓는 게 현명한 자세 아닐까요?

이번에도 역시나 OpenAI의 속도는 미쳤어요. GPT-4.1 출시한 지 며칠 됐다고, 벌써 새로운 모델을 또? Vision이고 뭐고 헷갈릴 지경입니다. 특히 이름들이 너무 비슷해서 “이거 4o이야? o4야?” 하게 되는 건 덤이죠.

 

Codeex: 직접 써보니 기대도 있고 아쉬움도 있는 새 도구

 

Codeex: 직접 써보니 기대도 있고 아쉬움도 있는 새 도구

  • Codeex는 OpenAI가 만든 오픈소스 CLI 도구로, 터미널이나 IDE에서 AI가 코드를 도와주는 방식이다.
  • 여러 AI 툴들과 비슷하지만, 항상 품질이 좋다고는 말 못 한다.
  • 개발자 도구 경쟁이 심해지면서 선택지도 많아지고 있다.

이번에 같이 나온 게 Codeex라는 툴인데요, 터미널에서 바로 AI랑 대화하면서 코딩을 할 수 있어요. 뭔가 SF 느낌 나지 않나요? 처음엔 좀 신기해서 이것저것 시켜봤는데... 음, 아직은 '기대만큼은 아니다'라는 말이 솔직한 리뷰일 것 같네요.

저는 이미 Copilot, Claude, Cursor, Firebase Studio, 뭐 이런 거 다 써봤어요. 근데 진짜 웃긴 게, 쓸수록 코드 질이 나아지는 게 아니라 점점 더 엉망이 되는 느낌이랄까요? 물론 제 실력 문제일 수도 있어요. 하지만 요즘은 도구가 너무 많아서 뭘 써야 할지도 헷갈려요. 경쟁이 치열한 만큼, 우리 개발자들 눈도 더 높아지는 건 어쩔 수 없겠죠.

 

개발자 도구 시장, 지금 완전 뜨겁습니다

  • 경제 불안정과는 별개로 개발자 도구 시장은 폭풍 성장 중이다.
  • OpenAI가 Windserve를 30억 달러에 인수할 가능성도 있다.
  • 단순히 VS Code 기반이라도, 잘 만든 포크 하나면 큰돈 벌 수 있는 시대다.

요즘처럼 경제가 불안할 때도 있는데, 신기하게도 개발자 툴 시장만큼은 활활 타오르고 있어요. 들리는 소문으론 OpenAI가 Windserve를 무려 30억 달러에 인수하려고 한다고 해요. 헐… 그냥 VS Code 살짝 튜닝한 거 아닌가요? Cursor도 비슷한데, 연 매출이 1억 달러 가까이 된다니 진짜 깜짝 놀랐어요.

그때 그 생각이 딱 들었어요. ‘아, 내가 Horse Tinder 만들 시간에 그냥 VS Code 복붙해서 하나 만들 걸…’

 

Microsoft도 조용히 있을 리 없죠

 

Microsoft도 조용히 있을 리 없죠

  • Microsoft는 Copilot에 Agent Mode를 추가해 기능을 확장하고 있다.
  • 이제는 AI가 상황을 읽고 작업을 진행할 수 있다.
  • 하지만 요즘 인기몰이 중인 건 Google의 Gemini 2.5다.

VS Code 만든 Microsoft도 가만히 있을 리가 없죠. Copilot을 Agent Mode로 업그레이드하면서 이제는 “파일도 만들고, 명령도 실행하고, 상황도 파악하고” 거의 비서처럼 변했어요. Cursor나 Windserve랑 제대로 한판 붙을 준비된 느낌이랄까요?

그런데 요즘 핫한 건 따로 있어요. Google의 Gemini 2.5. 쓰는 사람들 사이에선 “이게 진짜다”라는 얘기가 나올 정도예요. 저도 몇 번 써봤는데, 괜찮긴 하더라고요.

 

Firebase Studio 써보니 좋긴 한데, 아쉬움도 좀 있어요

  • Firebase Studio는 웹 기반 VS Code로, Gemini 2.5와 통합되어 있다.
  • 빠르고 사용하기 쉬운 게 장점이다.
  • 다만 사용자의 요청을 정확히 반영하지 못할 때가 있다.

Firebase Studio는 원래 Project IDX였죠. 지금은 웹에서 바로 개발하고 배포까지 가능한 IDE로 바뀌었고, Gemini 2.5랑 찰떡궁합이에요. 속도 빠르고 딱 봐도 익숙해서 편하긴 한데요…

제가 “Svelte 5로, 그리고 Runes 써서 코드 짜줘”라고 했더니, Next.js로 딱 바꿔버리는 겁니다? 당황스럽긴 했지만, 아마 React랑 Next.js 같은 대중적인 걸 기본값으로 쓰는 것 같아요. 뭐, 실무에서 많이 쓰니까 이해는 가죠. 근데 요청한 건 좀 지켜주지…

 

Codeex로 유튜브 클론 만들어본 썰 풀어볼게요

 

Codeex로 유튜브 클론 만들어본 썰 풀어볼게요

  • Codeex는 설치와 설정이 쉬우며, 기본적인 기능은 사용 가능하다.
  • 요구사항을 명확히 해야 하고, Windows에서는 문제가 생길 수도 있다.
  • Svelte 5 + Runes 같은 특수한 기술은 지원이 아직 부족하다.

설치 자체는 간단했어요. npm으로 깔고, OpenAI 키 설정하면 끝. 그다음에 “유튜브 클론 하나 만들어줘”라고 했더니… 음, ‘요구사항이 애매하다’며 다시 묻더라고요. 이거 완전 클라이언트 같지 않나요? ‘그냥 알아서 좀 해줘’라는 마음으로 던졌는데, 역시 AI도 그런 건 못하네요.

기다리다 지칠 무렵 결과물이 떴는데, 디렉터리만 몇 개 비어 있고... 코드는 터미널에 보이긴 했지만 실행도 안 되고. 제 생각엔 Windows에서 써서 그랬던 것 같아요. macOS라면 좀 더 괜찮았을지도?

그리고요, Svelte 5 + Runes로 다시 부탁했는데… 역시 또 실패했어요. 흑.

 

다른 툴들과 비교해보니… 다들 하나씩 아쉬움은 있네요

  • Claude Code는 Windows에서 잘 돌아가지만, 문법 구현에 한계가 있다.
  • Firebase Studio는 속도는 좋지만 사용자의 요청을 제대로 반영하지 못할 수 있다.

Claude Code도 써봤는데, 실행은 잘 돼요. Windows에서도 딱딱 돌아가더라고요. 근데 Rune 문법은 또 실패. 달러 기호 써서 뭔가 해보려 하던데, 결국 에러만 잔뜩 뿌리고 앱은 안 돌아갔어요.

Firebase Studio는 정말 빠르긴 해요. 근데 요청은 또 무시하고, Next.js로 돌려주더군요. 이쯤 되니 'AI에게 내 취향을 전하는 법'이라는 책이 필요하겠단 생각이 들었습니다.

 

느낀 점? 아직은 부족하지만, 앞으로가 더 기대돼요

  • 모든 AI 툴이 완벽하진 않으며, 각각 장단점이 뚜렷하다.
  • 기대도 실망도 너무 크지 않게, 균형 잡힌 시선이 필요하다.
  • 지금은 실험과 도전의 시기, 직접 써보며 익혀야 한다.

정리하자면, 지금 나온 도구 중에 '이거 하나면 끝!' 하는 건 없어요. 다들 하나씩 부족한 부분이 있더라고요. OpenAI가 말하는 ‘천재 AI’라는 것도 약간은 마케팅 같기도 하고요. 그렇다고 아예 무시할 필요도 없어요. 이건 분명히 진화 중이고, 점점 나아질 거라는 건 확실합니다.

그래서 결론은? 직접 써보는 게 최고예요. 이것저것 실험해보고, 실패도 해보고. 그러다 보면 언젠가는 “아, 이거구나” 싶은 순간이 오겠죠.

 

반응형