SW/인공지능

Gemini 3 Pro란? Bard 이후 구글이 다시 1등 모델로 떠오른 이유 정리

얇은생각 2026. 1. 2. 07:30
반응형

 

Bard가 넘어지고, Gemini 3가 일으킨 반전 드라마

솔직히 몇 년 전만 해도, 누가 “2025년 AI model 전쟁에서 Google이 1등 후보 될 것 같다”라고 말했다면… 대부분은 그냥 웃고 말았을 겁니다.
왜냐면 우리 다 기억하잖아요. Bard.

2023년 2월, Google이 첫 ChatGPT 경쟁작이라며 Bard를 라이브로 공개했을 때:

  • 데모 영상에서 James Webb 관련 내용을 대놓고 hallucination
  • 그 장면이 그대로 전 세계로 퍼짐
  • 바로 다음 날, Google 주가가 거의 9% 가까이 급락

 

연구를 반쯤 발명한 회사였는데, 정작 실제 product에서는 느리고 복잡하고, 관료제에 갇힌 공룡 기업처럼 보였죠.
“Google은 이제 혁신 못 한다”라는 내러티브가 꽤 오래 갔습니다.

근데 시간이 흘러 2025년 11월 21일.

Google이 Gemini 3를 내놓더니, 이번엔 정반대 상황이 펼쳐집니다.

  • 발표 직후 Google 주가 6% 상승, 사상 최고가 갱신
  • 각종 기준에서 “올해 안에 best AI model은 아마 Gemini 3가 될 것”이라는 평가 쏟아짐

 

그야말로 “몽골리안 리버설” 급 반전이죠.
그래서 자연스럽게 이런 질문이 나옵니다.

“진짜로 우리가 singularity에 더 가까워진 건가?”
“아니면 그냥 Bard가 Brian Johnson의 magic mushrooms 같은 걸 몰래 빤 건가?”

 

이 글에서는:

  • Gemini 3 Pro가 실제로 어느 정도까지 올라왔는지
  • 왜 benchmark에서 이렇게 난리를 치는지
  • 그리고 많은 사람이 잘 못 보고 지나치는, Google의 또 다른 카드
    agentic coding platform ‘anti-gravity’ 얘기까지 같이 풀어봅니다.

 

그리고 중간에 살짝 무서운 포인트도 하나 있어요.

AI가 AGI 되기도 전에, 이미 우리를 “manager of agents”라는 이름의 에너지 소스로 쓰기 시작했다는 거죠.

 

Bard 시절: “AI 시대의 최대 패자”라고 불리던 Google

 


1. Bard 시절: “AI 시대의 최대 패자”라고 불리던 Google

먼저 왜 사람들이 그렇게 Google을 의심했는지부터 짚고 갈게요.

Bard 런칭 (2023년 2월)

  • Google의 첫 ChatGPT 경쟁작, Bard
  • 라이브 스트림 데모 영상에서
    James Webb Space Telescope 관련 내용을 틀린 정보로 답변
  • 그 클립이 그대로 마케팅에 쓰였고, 바로 인터넷에서 난도질
  • 시장의 반응은 더 냉정했죠: 주가 약 9% 하락

 

이건 단순한 product 실패가 아니라, 상징적인 사건이었습니다.

  • AI research의 반은 Google 논문에서 나왔다고 해도 과언이 아닌데
  • 실제 consumer-facing product에서는 느리고 보수적
  • 내부에선 “승인 절차가 너무 많다”, “risk 회피가 심하다”는 얘기
  • 외부에선 “OpenAI가 미래, Google은 과거”라는 식의 평가

 

그렇게 꽤 오랫동안 시장과 개발자 커뮤니티는
“Google은 AI 전환에서 한 발 늦었다”라는 서사를 유지했죠.

그런데 이게 2025년 Gemini 3 릴리즈를 기점으로 확 뒤집히기 시작합니다.

 

 


2. Gemini 3 Pro: Benchmark를 쓸어 담는 괴물

이제 본론.
요즘 AI 얘기만 나오면 따라오는 단어: benchmark.

물론 다들 알고 있죠.

“benchmark가 전부는 아니다.”

 

맞습니다. 그렇지만 가끔씩 정말 예외적인 model이 등장해서,
한두 개가 아니라 각종 benchmark를 도미노처럼 쓸어버리는 순간이 있어요.

지금 그 역할을 하는 게 바로 Gemini 3 Pro입니다.

요즘 AI 연구자랑 builder들은 온갖 기상천외한 테스트를 만듭니다. 예를 들면:

  • 실루엣만 보고 Pokémon 캐릭터를 맞추게 한다든지
  • 가상의 vending machine business를 운영하게 해본다든지
    (재고, 가격, 전략까지 시뮬레이션)
  • 혹은 “이 model이 General Intelligence에 얼마나 가까운가”를
    간접적으로 측정해 보려고 별의별 괴랄한 과제를 던져보기도 하고요

 

이런 걸 통째로 모아놓은 각종 leaderboard들에서,
요즘 공통적으로 올라오는 패턴이 하나 있습니다.

“웬만한 걸 열어보면 Gemini 3 Pro가 맨 위에 있다.
그리고 차이가 꽤 난다.”

 

예를 들면:

  • 여러 LM arena leaderboard 1위
  • 기괴하고 창의적인 task를 모아놓은 weird ML 스타일 benchmark 상위권
  • 이름부터 심장 쫄리는 **“Humanity’s Last Exam”**에서도 압도적인 결과
  • 수학·논리력 검증용인 Math Arena 같은 세트에서도 강력한 성능

 

물론, benchmark는 충분히 “게임”할 수 있는 시스템입니다.
특정 task에 맞춰 finetune할 수도 있고, prompt engineering으로 점수를 당길 수도 있죠.

그래도 중요한 건 이거예요:

여러 종류의 benchmark에서, 동시에 좋은 점수를 내는 model은
그렇게 자주 등장하지 않는다.

이번 Gemini 3 Pro는 딱 그 케이스에 해당합니다.

그리고 benchmark가 마음에 안 든다면, 더 현실적인 증거도 있습니다.

 

 


3. 실제 서비스의 선택: AMP가 Claude에서 Gemini 3 Pro로 갈아탄 이유

Benchmark는 어디까지나 실험실의 점수입니다.
진짜 무서운 건, 실제 서비스들이 무엇을 쓰느냐죠.

여기서 중요한 사례 하나.

AMP라는 회사가 운영하던 coding agent에서
core model을 Claude → Gemini 3 Pro로 바꿨습니다.

 

그냥 “한 번 써봤다” 수준이 아니라, 완전히 교체했어요. 이유는 간단합니다.

“Claude Sonnet 4.5가 하던 걸
Gemini 3 Pro가 그대로 다 하면서, 전반적으로 더 잘해서.”

 

model 교체는 솔직히 장난이 아닙니다.

  • prompt를 전부 다시 손봐야 할 수도 있고
  • latency, cost 구조가 바뀔 수 있고
  • code generation, refactoring, multi-file edit, agent behavior 같은
    핵심 workflow를 다시 검증해야 합니다.

 

이 정도 부담을 감수하면서도 교체를 한다는 건,
실사용 기준에서 체감 성능 차이가 꽤 뚜렷했다는 뜻이죠.

즉, 요약하면:

  • 실험실: benchmark에서 Gemini 3 Pro가 거의 다 쓸어감
  • 실전: coding agent 같은 핵심 product에서도 실제로 model 교체가 일어남

 

그래서 지금 분위기가 “이제 개발자용 기본 default model 후보 중 하나는
거의 확실히 Gemini 3 Pro다” 쪽으로 기울고 있는 겁니다.

 

 


4. 그럼 이게 진짜 AGI에 가까워졌다는 뜻일까?

가장 자극적인 질문부터 정리해 봅시다.

“Gemini 3 Pro 나오고 나서, 진짜 AGI에 더 가까워진 거야?”

짧게 말하면:
아무도 정확히 모른다, 아는 척하는 사람이 더 수상하다 쪽에 가깝습니다.

다만 이런 건 확실합니다.

  • multi-step reasoning 쪽이 이전 세대 model보다 눈에 띄게 좋아짐
  • 특이하고 open-ended한 prompt에도 예전보다 덜 무너짐
  • 길고 복잡한 context를 다루면서도 흐름을 유지하는 능력이 개선됨

 

그래서 “느낌상 더 똑똑해 보이는” 건 맞지만,
이걸 곧바로 “의식”이나 “자아” 같은 개념과 연결하는 건 무리죠.

하지만, 살짝 섬뜩한 포인트는 있습니다.

model 자체보다 model이 연결되는 방식
점점 더 “병렬로 돌아가는 두 개의 시스템”에 가까워지고 있다는 것.

  • 한쪽에는 tool과 agent를 쓰는 AI system
  • 다른 한쪽에는 그 시스템을 감독하는 우리 인간

 

그러다가 어느 순간, 역할이 살짝 뒤집힐 수도 있습니다.
우리가 AI를 쓰는 게 아니라, 어느새 AI가 우리의 행동을 workflow의 일부로
설계하고 있을지도 모르니까요.

그리고 이 지점에서 등장하는 게 바로 Google의 또 다른 카드입니다.
이름은 꽤 과격해요. anti-gravity.

 

 


5. Anti-gravity: “Manager of Agents”로 승진한 당신

Gemini 3 Pro benchmark 얘기로 모두의 시선이 쏠려 있을 때,
Google은 또 하나의 흥미로운 걸 quietly 내놨습니다.

바로 agentic coding environment, 이름은 anti-gravity.

이름만 들으면 왠지:

“Back to the Future 2에 나오는 그 날아다니는 차
현실로 만든 전자기 부상 장치인가…?”

 

같지만, 아쉽게도 그런 건 전혀 아니고요.

현실의 anti-gravity는:

VS Code fork에 가까운 editor인데,
처음부터 끝까지 Gemini 기반 agentic coding에 최적화된 IDE입니다.

 

여기서 더 재밌는 건 그 뒷이야기입니다.

 

 

Windsurf에서 Google로, 그리고 다시 Anti-gravity로

얼마 전인 7월, 한 사건이 있었습니다.

  • AI 기반 dev environment인 Windsurf의 co-founder들이
    어느 날 직원들을 뒤에 남겨두고 퇴사
  • Windsurf core tech에 대한 non-exclusive license를 챙겨서
  • 약 24억 달러(2.4B) 규모의 딜로 Google 합류

 

그 이후로는 별다른 소식이 거의 없었죠.

“도대체 Google 안에서 뭘 만드는 거지?”
라는 추측만 떠돌다가, 이번에 드디어 결과물이 모습을 드러낸 겁니다.

 

그게 바로:

anti-gravity — Windsurf 출신 팀이 이끄는
새 agentic development platform.

 

공식 소개 영상에서 핵심 메시지를 한 줄로 요약하면 이렇습니다.

“축하합니다. 이제 당신은 manager of agents로 승진했습니다.”

 

즉, 앞으로는:

  • 직접 모든 코드를 타이핑하는 사람이 아니라
  • 여러 개의 coding agent가 작업하는 걸 설계하고
    review & approve 하는 사람이 된다는 얘기죠.

 

겉보기엔 되게 멋있고, 생산성도 엄청 좋아질 것 같아요.
근데 뒤집어서 보면 이렇기도 합니다.

AGI가 오기도 전에, AI가 먼저
“휴먼을 사람 in the loop manager”로 설계해 버린 것.

 

우리는 이제:

  • 각 agent에게 task를 assign하고
  • diff를 확인하고
  • risk를 판단하고
  • 최종 merge 여부를 결정하는
    middle manager 역할을 하게 됩니다.

 

물론 중요한 일을 하긴 하는데, 어딘가 좀… 직급만 그럴듯한 느낌이죠.

 

 

Cascade를 깜빡한 그 장면

Anti-gravity 발표에서 가장 웃픈 디테일 하나.

어딘가에서 agent name을 Windsurf 시절 이름인 “Cascade”로
바꾸지 않고 그대로 쓴 흔적
이 보였다는 것.

  • Cascade는 원래 Windsurf의 coding agent 이름이었습니다.
  • 그 이름이 Google product 데모에 그대로 남아있었다는 건
    마치… 새 연인 이름을 부르다가 무심코 전 애인 이름을 불러버린 느낌이랄까요.

 

작은 실수지만, 이 프로젝트의 계보와 뿌리를 그대로 보여주는 장면이기도 합니다.

그리고 이 모든 것 위에는 Gemini 3가 또 층층이 올라가 있죠.
model 위에 tool, 그 위에 agent, 그 위에 editor, 그 위에 우리.
정말로 turtles all the way down.

 

 


6. 경쟁자도 만만치 않다: Brain-rot IDE, “Chad”

물론 anti-gravity 혼자 뛰는 무대는 아닙니다.

가장 캐릭터가 강한 경쟁자 하나가 바로 Chad.
이름부터 묘하게 밈 느낌이 나죠.

Chad는 Y Combinator가 지원하는 brain-rot IDE입니다.
컨셉이 아주 간단하면서도 강렬해요.

다른 IDE들이 developer에게 집중하라고 잔소리할 때,
Chad는 오히려 brain-rot device를 그대로 workflow에 넣어버립니다.

 

즉:

  • 핸드폰으로 gamble 하든
  • TikTok endless scroll을 하든
  • Tinder에서 swipe 파티를 하든

 

그 와중에도 code agent들이 백그라운드에서:

  • refactoring 하고
  • bug fix 하고
  • feature implement까지 진행해 준다는 개념.

 

생산성 천국인지, 디지털 디스토피아인지 헷갈리는 setup이지만,
어쨌든 하나는 분명합니다.

이제 IDE는 단순한 text editor가 아니라
agent orchestration hub가 되고 있다는 것.

 

어떤 환경이든 앞으로의 IDE는:

  • agent plan을 보여주고
  • 실행 log를 모니터링하며
  • 우리와 agent가 협상하고 수정하는 control tower 역할을 하게 될 겁니다.

 

 


7. IDE 정글: idx, Firebase Studio, Jules, Notepad++

Anti-gravity와 Chad만 해도 복잡한데, Google 쪽만 놓고 봐도 꽤 정신없습니다.

정리해보면:

  • idx
    • Google이 밀었던 web-based editor
    • AI integration을 앞세웠지만…
    • 지금은 사실상 원래 모습은 사라지고,
      Firebase Studio라는 이름으로 재탄생한 상태
  • Firebase Studio
    • app development 전체 lifecycle을
      AI agents로 가속한다는 컨셉
    • 즉, 단순 editor를 넘어선 end-to-end dev environment
  • Jules
    • 또 하나의 Google 제품
    • autonomous coding agent 역할을 수행하는 툴

 

여기에:

  • anti-gravity – Gemini에 최적화된 agentic coding IDE
  • Chad – brain-rot를 workflow로 인정해 버린 YC 백업 IDE
  • 그리고 각자 쓰는
    VS Code, JetBrains, 그리고 영원한 생존자 Notepad++

 

이 모든 걸 합치면, 새 IDE를 찾는 developer는
거의 “툴 고를 시간에 side project 하나 더 만들 수 있겠다” 싶은 수준입니다.

하지만 이 정글 속에서 떼어낼 수 있는 흐름은 하나예요.

AI 시대의 IDE는 결국 **“AI agent의 집이자 control center”**가 된다.

  • agent가 어떤 plan으로 움직이는지 보여주고
  • 우리가 그 plan을 수정하거나 veto할 수 있게 하고
  • code뿐 아니라 workflow 전체를 눈에 보이게 만드는 공간

 

그리고 그 중심에 있는 model 중 하나가 지금의 Gemini 3 Pro인 거죠.

 

 


8. 이 모든 변화 속에서, “나”는 어떤 역할을 하게 될까?

이제 우리 입장에서 생각해 봅시다.
developer든, founder든, designer든, 앞으로의 일상은 어떻게 바뀔까요?

 

1) 단순한 coder에서 “system designer + reviewer”로

Anti-gravity나 Chad 같은 환경이 기본값이 되면,
우리가 하는 일은 이런 쪽으로 이동합니다.

  • “이 함수 어떻게 짜지?”보다
  • “이 task를 agent들에게 어떻게 쪼개서 던지고,
    어떤 기준으로 결과를 review할까?”가 더 중요해짐

 

결국 우리는:

  • agent workflow를 설계하고
  • constraint를 정의하고
  • code diff와 plan을 검토하는
    system designer + reviewer에 가까운 역할을 맡게 됩니다.

 

2) Benchmark보다 중요한 건 “내 use case에서의 안정성”

물론:

  • LM arena 1위
  • Humanity’s Last Exam 상위권
  • Math Arena 강자

 

이런 타이틀은 멋있습니다.
하지만 developer 관점에서 더 중요한 질문은 이거죠.

  • “내 domain에서 hallucination 얼마나 줄었냐?”
  • “내 codebase에 적용했을 때 generated code quality가 어떠냐?”
  • “tool 사용, API 호출, context handling이 실서비스 기준으로 믿을 만하냐?”

 

benchmark 1등이더라도,
가끔씩 CI를 작살내는 코드를 슬쩍 끼워 넣는 model이라면
차라리 점수 조금 낮더라도 안정적인 model이 더 나은 선택일 수 있습니다.

 

3) Agentic IDE는 피할 수 없는 흐름

Anti-gravity든, Firebase Studio든, Chad든,
혹은 직접 짠 custom tool이든, 방향성은 하나입니다.

“AI agents가 제안하고, human이 최종 판단한다.”

 

앞으로의 IDE에서는:

  • agent가 service 생성, 테스트 실행, bug report까지 수행하고
  • 우리는 로그와 plan을 보면서
    agent 전략을 debug하는 역할을 하게 될 겁니다.

 

단순히 “코드가 돌아가냐”를 보는 게 아니라,

“agent가 왜 이런 전략을 세웠는지,
이 방향이 product와 architecture에 맞는지”

를 검토하는 일이 늘어나겠죠.

 

4) 그래도 끝까지 남는 건 “taste”

아무리 model이 강력해지고 agent가 똑똑해져도,
AI가 대신 못 해주는 영역이 몇 가지 있습니다.

  • product sense
    • 이 feature, 정말 만들어야 할까?
    • 어떤 use case에 가장 큰 임팩트가 있을까?
  • UX intuition
    • 이 flow, 유저 입장에서 부드럽게 느껴질까?
    • 어디서 끊기고, 어디서 지루해질까?
  • engineering taste
    • 이 architecture, 나중에 scale할 수 있을까?
    • 이건 설계가 깔끔한 건지, 아니면 Jenga tower인지?

 

이런 “taste”는 여전히 human의 영역으로 남아 있고,
오히려 AI tool이 강력해질수록 그 중요도가 더 커질 가능성이 큽니다.

그리고 여기서 재미있게 연결되는 게 하나 있습니다.
바로 Mobin.com 같은 툴입니다.

 

 


9. Mobin.com: 요즘식 “UI/UX 레퍼런스 도감”

AI model이 아무리 똑똑해도,
결국 사람들은 **“손으로 만지는 화면”**을 보고 평가합니다.

그럼 우리 입장에서는 이런 고민이 생기죠.

“좋은 UI/UX를 빠르게 참고할 수 있는 레퍼런스가 있으면 좋겠다.”

여기서 등장하는 게 바로 Mobin.com 같은 서비스입니다.

 

Mobin의 핵심은 간단합니다.

전 세계 인기 앱들의 각 screen을 매우 디테일하게 분해해서
한눈에 볼 수 있게 정리해 둔 UI/UX reference 라이브러리.

 

예를 들면:

  • 특정 UI element (button, modal, filter, tab bar 등)만 골라서 비교해볼 수 있고
  • onboarding flow, checkout flow, subscription flow처럼
    전체 user journey 기준으로도 분석할 수 있습니다.

 

그리고 나서:

  • 마음에 드는 패턴을 그대로 Figma에 copy & paste해서 시작점으로 쓰고
  • 거기서 brand와 product에 맞게 customize하면 됩니다.

 

최근에는 여기에 animation collection도 추가됐습니다.

  • top app들이 쓰는 micro interaction들을 그대로 구경할 수 있고
  • hover, tap, transition 같은
    whimsical한 detail들이 실제로 어떻게 구현되는지 볼 수 있죠.
  • 우리가 말하는 그 “smooth monkey brain을 살살 간지럽히는” 인터랙션들입니다.

 

정리하자면:

  • Gemini 3 Pro + agentic IDE → logic, code, workflow를 빠르게 밀어줌
  • Mobin.com → 화면 구성, UX 패턴, animation 아이디어를 한 방에 모아줌

 

이 둘을 같이 쓰면,

“AI가 구현을 돕고,
Mobin이 화면과 경험의 레퍼런스를 제공하고,
나는 전체적인 direction과 taste를 결정하는 사람”

 

이라는 그림이 만들어집니다.

참고로 Mobin은 무료로 먼저 써볼 수 있고,
특정 링크를 통해 가입하면 추가 20% discount가 붙는 플랜도 있습니다
(영상/블로그 sponsor context 기준).

 

 


10. 한 줄 정리: “Google은 다시 돌아왔는가?”

마지막으로 한 번 전체를 조망해봅시다.

과거:

  • **Bard 런칭 실패(2023)**로
    Google은 “AI 시대 최대 패자” 취급을 받았고
  • narrative를 OpenAI, Anthropic에게 거의 뺏긴 상태였죠.

 

현재(2025년 말):

  • Gemini 3 Pro는 benchmark와 실제 서비스 양쪽에서
    강력한 top-tier model로 인정받는 분위기
  • anti-gravity, Firebase Studio, Jules 등으로
    agentic development에 풀스택으로 들어온 모습
  • Windsurf 출신 팀까지 합류하면서,
    “IDE + agent + model”을 한 번에 묶는 platform 전략이 가속 중

 

이게 “Google이 AI 전쟁에서 최종 승자다”라는 뜻은 아닙니다.
다만 한 가지는 확실해요.

“이제 더 이상 한 회사의 독주가 아니라,
진짜 경쟁이 다시 시작된 구도라는 것.”

 

우리에게 중요한 건 승부 예측이 아니라,
이 환경에서 어떻게 내 역량을 쌓고, 무엇을 만들어낼 것인지입니다.

그래서 개인에게 추천하고 싶은 방향은 대략 이렇습니다.

  • 특정 회사나 model에 종교처럼 lock-in 되지 말고
  • 다양한 model과 agentic IDE를 실험해 보고
  • agent를 관리하고 orchestration하는 감각을 키우고
  • 여전히 인간에게 남아 있는
    product sense, UX 직관, system design 능력을 갈고 닦는 것

 

밤에 노트북 팬 돌아가는 소리를 들으면서:

  • 한쪽에는 Gemini 3 Pro에 task를 던져 놓고
  • 다른 한쪽에서는 Mobin으로 UI reference를 훑어보면서
  • 중간에서 “어떤 걸 실제로 ship할지”를 결정하는 사람

 

이 역할을 잘 해낼 수 있다면,
누가 이번 benchmark 전쟁에서 이기든,
당신 자리는 꽤 오래 안전할 가능성이 높습니다.

물론, 가끔은 test 돌려놓고
살짝 Tinder swipe 정도는… 할 수도 있겠죠.
agent가 background에서 열심히 일해주고 있으니까요.

 

 


FAQ: 2025년 Gemini 3, Agentic Coding, IDE에 대해 자주 나올 법한 질문들

Q1. Gemini 3 Pro를 한 줄로 설명하면 뭐예요?
→ 자연어, code, reasoning, math, tool-use까지 광범위하게 커버하는 Google의 최신 LLM입니다. 긴 context를 다루면서도 꽤 안정적인 편이라, 범용 assistant이자 coding partner로 쓰기 좋은 model이라고 보면 됩니다.

 


Q2. 왜 다들 Gemini 3 benchmark 얘기를 그렇게 많이 해요?
→ 각종 LM arena leaderboard, Humanity’s Last Exam, Math Arena 같은 benchmark에서 상위권을 휩쓸고 있기 때문입니다. 다양한 task에서 consistently 좋은 성능을 내는 model은 드문 편이라, 연구자와 builder들 사이에서 관심이 크게 집중된 상태입니다.

 


Q3. 이 정도면 AGI 근처까지 온 건가요?
→ 아직은 아닙니다. Gemini 3 Pro는 pattern recognition과 reasoning 능력이 전에 비해 크게 향상된 model이지만, “의식이 있다”거나 “스스로 목적을 세운다”는 의미의 AGI와는 거리가 있습니다. 다만 tool과 agent를 엮는 방식 때문에 체감 지능이 훨씬 높게 느껴지는 건 사실입니다.

 


Q4. Anti-gravity는 정확히 뭐 하는 툴이에요?
→ Google이 새로 내놓은 agentic coding platform입니다. 겉으로 보면 VS Code fork처럼 생겼지만, 내부적으로는 Gemini 기반 code agent들이 plan → edit → refactor → test까지 상당 부분 자동으로 처리해 주는 IDE라고 생각하면 됩니다. 우리는 그 결과물을 review하고 방향을 잡아주는 manager of agents 역할을 하게 되죠.

 


Q5. Windsurf랑은 어떤 관계인가요?
→ 예전에 Windsurf라는 dev environment를 만들던 co-founder들이, Windsurf tech에 대한 non-exclusive license를 들고 약 2.4B 달러 규모의 딜로 Google에 합류했습니다. 이번 anti-gravity가 그 팀이 주도한 결과물이고, 데모 중에 예전 agent 이름인 **“Cascade”**가 그대로 노출된 걸 보면, Windsurf DNA가 꽤 많이 녹아 있는 것으로 보입니다.

 


Q6. “Chad”라는 brain-rot IDE는 뭐예요?
Y Combinator가 지원하는 IDE로, 컨셉이 아주 솔직합니다. TikTok, Tinder, mobile game 같은 brain-rot device를 쓰면서도, background에서 AI agent가 code 작업을 계속 진행해 주는 agentic IDE입니다. 반쯤 농담 같지만, 실제로 agent-first dev workflow를 실험하는 serious product이기도 합니다.

 


Q7. idx는 사라진 건가요? Firebase Studio는 또 뭐죠?
→ 기존의 idx는 지금 사실상 그 형태를 잃고, Firebase Studio라는 이름으로 재정렬된 상태입니다. Firebase Studio는 app development 전체 lifecycle을 AI agents로 가속하는 platform을 지향하고 있고, 이것 역시 Google이 agentic development에 꽤 진지하게 들어왔다는 신호로 볼 수 있습니다.

 


Q8. Coding 기준에서 Gemini 3 Pro vs Claude Sonnet 4.5, 어떻게 보나요?
→ 세부적인 비교는 use case마다 다르겠지만, 하나의 강력한 신호는 AMP처럼 실전에서 Claude Sonnet 4.5를 쓰던 서비스가 Gemini 3 Pro로 완전히 갈아탔다는 사실입니다. 그 정도 비용과 리스크를 감수하고도 교체했다는 건, coding task에서 Gemini 3 Pro가 적어도 상당 부분 우위에 있다는 뜻으로 읽힙니다.

 


Q9. 지금 당장 anti-gravity나 Chad 같은 agentic IDE를 써야 할까요?
→ “써야 한다”까지는 아니지만, 테스트해 볼 가치는 충분히 있습니다. side project나 non-critical한 repo에 먼저 적용해 보면서, agent behavior와 diff 품질을 체감해 보고, 괜찮다고 느껴지면 메인 workflow에 천천히 섞어 넣는 방식이 좋습니다.

 


Q10. AI agent가 결국 developer를 완전히 대체할까요?
→ 가까운 미래에는 그럴 가능성이 낮습니다. agent가 code generation, refactoring, migration에는 매우 강하지만, 애매한 요구사항을 정리하고, product 방향을 잡고, long-term architecture를 설계하는 일은 여전히 인간의 역할입니다. 오히려 developer는 system designer + reviewer + product thinker 쪽으로 진화하게 될 가능성이 더 큽니다.

 


Q11. Mobin.com 같은 서비스는 이 그림에서 어떤 역할을 하나요?
→ Gemini 3 Pro나 agentic IDE가 logic과 code를 밀어주는 쪽이라면, Mobin.comUI/UX reference와 design 패턴을 공급하는 쪽입니다. 인기 앱들의 screen, flow, animation을 breakdown한 라이브러리를 제공하기 때문에, “어떤 UI가 실제로 잘 먹히는지”를 빠르게 참고할 수 있습니다. 이 둘을 같이 쓰면, 실행력과 완성도를 동시에 끌어올리기 좋아요.

 


Q12. 이 AI-heavy 시대에 내 커리어를 어떻게 준비하는 게 좋을까요?
→ 요약하면, AI와 경쟁하지 말고 AI 위에 쌓이는 쪽을 선택하는 게 좋습니다.

  • 단순한 호출이 아니라, agent orchestration과 workflow design 감각 기르기
  • product sense와 UX intuition을 의식적으로 훈련하기
  • architecture, trade-off, scaling을 아는 systems thinking 익히기
  • 하나의 model에 올인하지 말고, 다양한 tool과 IDE를 실험하는 습관 들이기

 

이렇게 가면, benchmark 순위가 어떻게 바뀌든,
당신은 그 위에서 “무엇을 만들 것인가”를 결정하는 사람으로 남을 가능성이 큽니다.

반응형