Bard가 넘어지고, Gemini 3가 일으킨 반전 드라마
솔직히 몇 년 전만 해도, 누가 “2025년 AI model 전쟁에서 Google이 1등 후보 될 것 같다”라고 말했다면… 대부분은 그냥 웃고 말았을 겁니다.
왜냐면 우리 다 기억하잖아요. Bard.
2023년 2월, Google이 첫 ChatGPT 경쟁작이라며 Bard를 라이브로 공개했을 때:
- 데모 영상에서 James Webb 관련 내용을 대놓고 hallucination
- 그 장면이 그대로 전 세계로 퍼짐
- 바로 다음 날, Google 주가가 거의 9% 가까이 급락
연구를 반쯤 발명한 회사였는데, 정작 실제 product에서는 느리고 복잡하고, 관료제에 갇힌 공룡 기업처럼 보였죠.
“Google은 이제 혁신 못 한다”라는 내러티브가 꽤 오래 갔습니다.
근데 시간이 흘러 2025년 11월 21일.
Google이 Gemini 3를 내놓더니, 이번엔 정반대 상황이 펼쳐집니다.
- 발표 직후 Google 주가 6% 상승, 사상 최고가 갱신
- 각종 기준에서 “올해 안에 best AI model은 아마 Gemini 3가 될 것”이라는 평가 쏟아짐
그야말로 “몽골리안 리버설” 급 반전이죠.
그래서 자연스럽게 이런 질문이 나옵니다.
“진짜로 우리가 singularity에 더 가까워진 건가?”
“아니면 그냥 Bard가 Brian Johnson의 magic mushrooms 같은 걸 몰래 빤 건가?”
이 글에서는:
- Gemini 3 Pro가 실제로 어느 정도까지 올라왔는지
- 왜 benchmark에서 이렇게 난리를 치는지
- 그리고 많은 사람이 잘 못 보고 지나치는, Google의 또 다른 카드
agentic coding platform ‘anti-gravity’ 얘기까지 같이 풀어봅니다.
그리고 중간에 살짝 무서운 포인트도 하나 있어요.
AI가 AGI 되기도 전에, 이미 우리를 “manager of agents”라는 이름의 에너지 소스로 쓰기 시작했다는 거죠.

1. Bard 시절: “AI 시대의 최대 패자”라고 불리던 Google
먼저 왜 사람들이 그렇게 Google을 의심했는지부터 짚고 갈게요.
Bard 런칭 (2023년 2월)
- Google의 첫 ChatGPT 경쟁작, Bard
- 라이브 스트림 데모 영상에서
James Webb Space Telescope 관련 내용을 틀린 정보로 답변 - 그 클립이 그대로 마케팅에 쓰였고, 바로 인터넷에서 난도질
- 시장의 반응은 더 냉정했죠: 주가 약 9% 하락
이건 단순한 product 실패가 아니라, 상징적인 사건이었습니다.
- AI research의 반은 Google 논문에서 나왔다고 해도 과언이 아닌데
- 실제 consumer-facing product에서는 느리고 보수적
- 내부에선 “승인 절차가 너무 많다”, “risk 회피가 심하다”는 얘기
- 외부에선 “OpenAI가 미래, Google은 과거”라는 식의 평가
그렇게 꽤 오랫동안 시장과 개발자 커뮤니티는
“Google은 AI 전환에서 한 발 늦었다”라는 서사를 유지했죠.
그런데 이게 2025년 Gemini 3 릴리즈를 기점으로 확 뒤집히기 시작합니다.
2. Gemini 3 Pro: Benchmark를 쓸어 담는 괴물
이제 본론.
요즘 AI 얘기만 나오면 따라오는 단어: benchmark.
물론 다들 알고 있죠.
“benchmark가 전부는 아니다.”
맞습니다. 그렇지만 가끔씩 정말 예외적인 model이 등장해서,
한두 개가 아니라 각종 benchmark를 도미노처럼 쓸어버리는 순간이 있어요.
지금 그 역할을 하는 게 바로 Gemini 3 Pro입니다.
요즘 AI 연구자랑 builder들은 온갖 기상천외한 테스트를 만듭니다. 예를 들면:
- 실루엣만 보고 Pokémon 캐릭터를 맞추게 한다든지
- 가상의 vending machine business를 운영하게 해본다든지
(재고, 가격, 전략까지 시뮬레이션) - 혹은 “이 model이 General Intelligence에 얼마나 가까운가”를
간접적으로 측정해 보려고 별의별 괴랄한 과제를 던져보기도 하고요
이런 걸 통째로 모아놓은 각종 leaderboard들에서,
요즘 공통적으로 올라오는 패턴이 하나 있습니다.
“웬만한 걸 열어보면 Gemini 3 Pro가 맨 위에 있다.
그리고 차이가 꽤 난다.”
예를 들면:
- 여러 LM arena leaderboard 1위
- 기괴하고 창의적인 task를 모아놓은 weird ML 스타일 benchmark 상위권
- 이름부터 심장 쫄리는 **“Humanity’s Last Exam”**에서도 압도적인 결과
- 수학·논리력 검증용인 Math Arena 같은 세트에서도 강력한 성능
물론, benchmark는 충분히 “게임”할 수 있는 시스템입니다.
특정 task에 맞춰 finetune할 수도 있고, prompt engineering으로 점수를 당길 수도 있죠.
그래도 중요한 건 이거예요:
여러 종류의 benchmark에서, 동시에 좋은 점수를 내는 model은
그렇게 자주 등장하지 않는다.
이번 Gemini 3 Pro는 딱 그 케이스에 해당합니다.
그리고 benchmark가 마음에 안 든다면, 더 현실적인 증거도 있습니다.
3. 실제 서비스의 선택: AMP가 Claude에서 Gemini 3 Pro로 갈아탄 이유
Benchmark는 어디까지나 실험실의 점수입니다.
진짜 무서운 건, 실제 서비스들이 무엇을 쓰느냐죠.
여기서 중요한 사례 하나.
AMP라는 회사가 운영하던 coding agent에서
core model을 Claude → Gemini 3 Pro로 바꿨습니다.
그냥 “한 번 써봤다” 수준이 아니라, 완전히 교체했어요. 이유는 간단합니다.
“Claude Sonnet 4.5가 하던 걸
Gemini 3 Pro가 그대로 다 하면서, 전반적으로 더 잘해서.”
model 교체는 솔직히 장난이 아닙니다.
- prompt를 전부 다시 손봐야 할 수도 있고
- latency, cost 구조가 바뀔 수 있고
- code generation, refactoring, multi-file edit, agent behavior 같은
핵심 workflow를 다시 검증해야 합니다.
이 정도 부담을 감수하면서도 교체를 한다는 건,
실사용 기준에서 체감 성능 차이가 꽤 뚜렷했다는 뜻이죠.
즉, 요약하면:
- 실험실: benchmark에서 Gemini 3 Pro가 거의 다 쓸어감
- 실전: coding agent 같은 핵심 product에서도 실제로 model 교체가 일어남
그래서 지금 분위기가 “이제 개발자용 기본 default model 후보 중 하나는
거의 확실히 Gemini 3 Pro다” 쪽으로 기울고 있는 겁니다.
4. 그럼 이게 진짜 AGI에 가까워졌다는 뜻일까?
가장 자극적인 질문부터 정리해 봅시다.
“Gemini 3 Pro 나오고 나서, 진짜 AGI에 더 가까워진 거야?”
짧게 말하면:
아무도 정확히 모른다, 아는 척하는 사람이 더 수상하다 쪽에 가깝습니다.
다만 이런 건 확실합니다.
- multi-step reasoning 쪽이 이전 세대 model보다 눈에 띄게 좋아짐
- 특이하고 open-ended한 prompt에도 예전보다 덜 무너짐
- 길고 복잡한 context를 다루면서도 흐름을 유지하는 능력이 개선됨
그래서 “느낌상 더 똑똑해 보이는” 건 맞지만,
이걸 곧바로 “의식”이나 “자아” 같은 개념과 연결하는 건 무리죠.
하지만, 살짝 섬뜩한 포인트는 있습니다.
model 자체보다 model이 연결되는 방식이
점점 더 “병렬로 돌아가는 두 개의 시스템”에 가까워지고 있다는 것.
- 한쪽에는 tool과 agent를 쓰는 AI system
- 다른 한쪽에는 그 시스템을 감독하는 우리 인간
그러다가 어느 순간, 역할이 살짝 뒤집힐 수도 있습니다.
우리가 AI를 쓰는 게 아니라, 어느새 AI가 우리의 행동을 workflow의 일부로
설계하고 있을지도 모르니까요.
그리고 이 지점에서 등장하는 게 바로 Google의 또 다른 카드입니다.
이름은 꽤 과격해요. anti-gravity.
5. Anti-gravity: “Manager of Agents”로 승진한 당신
Gemini 3 Pro benchmark 얘기로 모두의 시선이 쏠려 있을 때,
Google은 또 하나의 흥미로운 걸 quietly 내놨습니다.
바로 agentic coding environment, 이름은 anti-gravity.
이름만 들으면 왠지:
“Back to the Future 2에 나오는 그 날아다니는 차를
현실로 만든 전자기 부상 장치인가…?”
같지만, 아쉽게도 그런 건 전혀 아니고요.
현실의 anti-gravity는:
VS Code fork에 가까운 editor인데,
처음부터 끝까지 Gemini 기반 agentic coding에 최적화된 IDE입니다.
여기서 더 재밌는 건 그 뒷이야기입니다.
Windsurf에서 Google로, 그리고 다시 Anti-gravity로
얼마 전인 7월, 한 사건이 있었습니다.
- AI 기반 dev environment인 Windsurf의 co-founder들이
어느 날 직원들을 뒤에 남겨두고 퇴사 - Windsurf core tech에 대한 non-exclusive license를 챙겨서
- 약 24억 달러(2.4B) 규모의 딜로 Google 합류
그 이후로는 별다른 소식이 거의 없었죠.
“도대체 Google 안에서 뭘 만드는 거지?”
라는 추측만 떠돌다가, 이번에 드디어 결과물이 모습을 드러낸 겁니다.
그게 바로:
anti-gravity — Windsurf 출신 팀이 이끄는
새 agentic development platform.
공식 소개 영상에서 핵심 메시지를 한 줄로 요약하면 이렇습니다.
“축하합니다. 이제 당신은 manager of agents로 승진했습니다.”
즉, 앞으로는:
- 직접 모든 코드를 타이핑하는 사람이 아니라
- 여러 개의 coding agent가 작업하는 걸 설계하고
review & approve 하는 사람이 된다는 얘기죠.
겉보기엔 되게 멋있고, 생산성도 엄청 좋아질 것 같아요.
근데 뒤집어서 보면 이렇기도 합니다.
AGI가 오기도 전에, AI가 먼저
“휴먼을 사람 in the loop manager”로 설계해 버린 것.
우리는 이제:
- 각 agent에게 task를 assign하고
- diff를 확인하고
- risk를 판단하고
- 최종 merge 여부를 결정하는
middle manager 역할을 하게 됩니다.
물론 중요한 일을 하긴 하는데, 어딘가 좀… 직급만 그럴듯한 느낌이죠.
Cascade를 깜빡한 그 장면
Anti-gravity 발표에서 가장 웃픈 디테일 하나.
어딘가에서 agent name을 Windsurf 시절 이름인 “Cascade”로
바꾸지 않고 그대로 쓴 흔적이 보였다는 것.
- Cascade는 원래 Windsurf의 coding agent 이름이었습니다.
- 그 이름이 Google product 데모에 그대로 남아있었다는 건
마치… 새 연인 이름을 부르다가 무심코 전 애인 이름을 불러버린 느낌이랄까요.
작은 실수지만, 이 프로젝트의 계보와 뿌리를 그대로 보여주는 장면이기도 합니다.
그리고 이 모든 것 위에는 Gemini 3가 또 층층이 올라가 있죠.
model 위에 tool, 그 위에 agent, 그 위에 editor, 그 위에 우리.
정말로 turtles all the way down.
6. 경쟁자도 만만치 않다: Brain-rot IDE, “Chad”
물론 anti-gravity 혼자 뛰는 무대는 아닙니다.
가장 캐릭터가 강한 경쟁자 하나가 바로 Chad.
이름부터 묘하게 밈 느낌이 나죠.
Chad는 Y Combinator가 지원하는 brain-rot IDE입니다.
컨셉이 아주 간단하면서도 강렬해요.
다른 IDE들이 developer에게 집중하라고 잔소리할 때,
Chad는 오히려 brain-rot device를 그대로 workflow에 넣어버립니다.
즉:
- 핸드폰으로 gamble 하든
- TikTok endless scroll을 하든
- Tinder에서 swipe 파티를 하든
그 와중에도 code agent들이 백그라운드에서:
- refactoring 하고
- bug fix 하고
- feature implement까지 진행해 준다는 개념.
생산성 천국인지, 디지털 디스토피아인지 헷갈리는 setup이지만,
어쨌든 하나는 분명합니다.
이제 IDE는 단순한 text editor가 아니라
agent orchestration hub가 되고 있다는 것.
어떤 환경이든 앞으로의 IDE는:
- agent plan을 보여주고
- 실행 log를 모니터링하며
- 우리와 agent가 협상하고 수정하는 control tower 역할을 하게 될 겁니다.
7. IDE 정글: idx, Firebase Studio, Jules, Notepad++
Anti-gravity와 Chad만 해도 복잡한데, Google 쪽만 놓고 봐도 꽤 정신없습니다.
정리해보면:
- idx
- Google이 밀었던 web-based editor
- AI integration을 앞세웠지만…
- 지금은 사실상 원래 모습은 사라지고,
Firebase Studio라는 이름으로 재탄생한 상태
- Firebase Studio
- app development 전체 lifecycle을
AI agents로 가속한다는 컨셉 - 즉, 단순 editor를 넘어선 end-to-end dev environment
- app development 전체 lifecycle을
- Jules
- 또 하나의 Google 제품
- autonomous coding agent 역할을 수행하는 툴
여기에:
- anti-gravity – Gemini에 최적화된 agentic coding IDE
- Chad – brain-rot를 workflow로 인정해 버린 YC 백업 IDE
- 그리고 각자 쓰는
VS Code, JetBrains, 그리고 영원한 생존자 Notepad++
이 모든 걸 합치면, 새 IDE를 찾는 developer는
거의 “툴 고를 시간에 side project 하나 더 만들 수 있겠다” 싶은 수준입니다.
하지만 이 정글 속에서 떼어낼 수 있는 흐름은 하나예요.
AI 시대의 IDE는 결국 **“AI agent의 집이자 control center”**가 된다.
- agent가 어떤 plan으로 움직이는지 보여주고
- 우리가 그 plan을 수정하거나 veto할 수 있게 하고
- code뿐 아니라 workflow 전체를 눈에 보이게 만드는 공간
그리고 그 중심에 있는 model 중 하나가 지금의 Gemini 3 Pro인 거죠.
8. 이 모든 변화 속에서, “나”는 어떤 역할을 하게 될까?
이제 우리 입장에서 생각해 봅시다.
developer든, founder든, designer든, 앞으로의 일상은 어떻게 바뀔까요?
1) 단순한 coder에서 “system designer + reviewer”로
Anti-gravity나 Chad 같은 환경이 기본값이 되면,
우리가 하는 일은 이런 쪽으로 이동합니다.
- “이 함수 어떻게 짜지?”보다
- “이 task를 agent들에게 어떻게 쪼개서 던지고,
어떤 기준으로 결과를 review할까?”가 더 중요해짐
결국 우리는:
- agent workflow를 설계하고
- constraint를 정의하고
- code diff와 plan을 검토하는
system designer + reviewer에 가까운 역할을 맡게 됩니다.
2) Benchmark보다 중요한 건 “내 use case에서의 안정성”
물론:
- LM arena 1위
- Humanity’s Last Exam 상위권
- Math Arena 강자
이런 타이틀은 멋있습니다.
하지만 developer 관점에서 더 중요한 질문은 이거죠.
- “내 domain에서 hallucination 얼마나 줄었냐?”
- “내 codebase에 적용했을 때 generated code quality가 어떠냐?”
- “tool 사용, API 호출, context handling이 실서비스 기준으로 믿을 만하냐?”
benchmark 1등이더라도,
가끔씩 CI를 작살내는 코드를 슬쩍 끼워 넣는 model이라면
차라리 점수 조금 낮더라도 안정적인 model이 더 나은 선택일 수 있습니다.
3) Agentic IDE는 피할 수 없는 흐름
Anti-gravity든, Firebase Studio든, Chad든,
혹은 직접 짠 custom tool이든, 방향성은 하나입니다.
“AI agents가 제안하고, human이 최종 판단한다.”
앞으로의 IDE에서는:
- agent가 service 생성, 테스트 실행, bug report까지 수행하고
- 우리는 로그와 plan을 보면서
agent 전략을 debug하는 역할을 하게 될 겁니다.
단순히 “코드가 돌아가냐”를 보는 게 아니라,
“agent가 왜 이런 전략을 세웠는지,
이 방향이 product와 architecture에 맞는지”
를 검토하는 일이 늘어나겠죠.
4) 그래도 끝까지 남는 건 “taste”
아무리 model이 강력해지고 agent가 똑똑해져도,
AI가 대신 못 해주는 영역이 몇 가지 있습니다.
- product sense
- 이 feature, 정말 만들어야 할까?
- 어떤 use case에 가장 큰 임팩트가 있을까?
- UX intuition
- 이 flow, 유저 입장에서 부드럽게 느껴질까?
- 어디서 끊기고, 어디서 지루해질까?
- engineering taste
- 이 architecture, 나중에 scale할 수 있을까?
- 이건 설계가 깔끔한 건지, 아니면 Jenga tower인지?
이런 “taste”는 여전히 human의 영역으로 남아 있고,
오히려 AI tool이 강력해질수록 그 중요도가 더 커질 가능성이 큽니다.
그리고 여기서 재미있게 연결되는 게 하나 있습니다.
바로 Mobin.com 같은 툴입니다.
9. Mobin.com: 요즘식 “UI/UX 레퍼런스 도감”
AI model이 아무리 똑똑해도,
결국 사람들은 **“손으로 만지는 화면”**을 보고 평가합니다.
그럼 우리 입장에서는 이런 고민이 생기죠.
“좋은 UI/UX를 빠르게 참고할 수 있는 레퍼런스가 있으면 좋겠다.”
여기서 등장하는 게 바로 Mobin.com 같은 서비스입니다.
Mobin의 핵심은 간단합니다.
전 세계 인기 앱들의 각 screen을 매우 디테일하게 분해해서
한눈에 볼 수 있게 정리해 둔 UI/UX reference 라이브러리.
예를 들면:
- 특정 UI element (button, modal, filter, tab bar 등)만 골라서 비교해볼 수 있고
- onboarding flow, checkout flow, subscription flow처럼
전체 user journey 기준으로도 분석할 수 있습니다.
그리고 나서:
- 마음에 드는 패턴을 그대로 Figma에 copy & paste해서 시작점으로 쓰고
- 거기서 brand와 product에 맞게 customize하면 됩니다.
최근에는 여기에 animation collection도 추가됐습니다.
- top app들이 쓰는 micro interaction들을 그대로 구경할 수 있고
- hover, tap, transition 같은
whimsical한 detail들이 실제로 어떻게 구현되는지 볼 수 있죠. - 우리가 말하는 그 “smooth monkey brain을 살살 간지럽히는” 인터랙션들입니다.
정리하자면:
- Gemini 3 Pro + agentic IDE → logic, code, workflow를 빠르게 밀어줌
- Mobin.com → 화면 구성, UX 패턴, animation 아이디어를 한 방에 모아줌
이 둘을 같이 쓰면,
“AI가 구현을 돕고,
Mobin이 화면과 경험의 레퍼런스를 제공하고,
나는 전체적인 direction과 taste를 결정하는 사람”
이라는 그림이 만들어집니다.
참고로 Mobin은 무료로 먼저 써볼 수 있고,
특정 링크를 통해 가입하면 추가 20% discount가 붙는 플랜도 있습니다
(영상/블로그 sponsor context 기준).
10. 한 줄 정리: “Google은 다시 돌아왔는가?”
마지막으로 한 번 전체를 조망해봅시다.
과거:
- **Bard 런칭 실패(2023)**로
Google은 “AI 시대 최대 패자” 취급을 받았고 - narrative를 OpenAI, Anthropic에게 거의 뺏긴 상태였죠.
현재(2025년 말):
- Gemini 3 Pro는 benchmark와 실제 서비스 양쪽에서
강력한 top-tier model로 인정받는 분위기 - anti-gravity, Firebase Studio, Jules 등으로
agentic development에 풀스택으로 들어온 모습 - Windsurf 출신 팀까지 합류하면서,
“IDE + agent + model”을 한 번에 묶는 platform 전략이 가속 중
이게 “Google이 AI 전쟁에서 최종 승자다”라는 뜻은 아닙니다.
다만 한 가지는 확실해요.
“이제 더 이상 한 회사의 독주가 아니라,
진짜 경쟁이 다시 시작된 구도라는 것.”
우리에게 중요한 건 승부 예측이 아니라,
이 환경에서 어떻게 내 역량을 쌓고, 무엇을 만들어낼 것인지입니다.
그래서 개인에게 추천하고 싶은 방향은 대략 이렇습니다.
- 특정 회사나 model에 종교처럼 lock-in 되지 말고
- 다양한 model과 agentic IDE를 실험해 보고
- agent를 관리하고 orchestration하는 감각을 키우고
- 여전히 인간에게 남아 있는
product sense, UX 직관, system design 능력을 갈고 닦는 것
밤에 노트북 팬 돌아가는 소리를 들으면서:
- 한쪽에는 Gemini 3 Pro에 task를 던져 놓고
- 다른 한쪽에서는 Mobin으로 UI reference를 훑어보면서
- 중간에서 “어떤 걸 실제로 ship할지”를 결정하는 사람
이 역할을 잘 해낼 수 있다면,
누가 이번 benchmark 전쟁에서 이기든,
당신 자리는 꽤 오래 안전할 가능성이 높습니다.
물론, 가끔은 test 돌려놓고
살짝 Tinder swipe 정도는… 할 수도 있겠죠.
agent가 background에서 열심히 일해주고 있으니까요.
FAQ: 2025년 Gemini 3, Agentic Coding, IDE에 대해 자주 나올 법한 질문들
Q1. Gemini 3 Pro를 한 줄로 설명하면 뭐예요?
→ 자연어, code, reasoning, math, tool-use까지 광범위하게 커버하는 Google의 최신 LLM입니다. 긴 context를 다루면서도 꽤 안정적인 편이라, 범용 assistant이자 coding partner로 쓰기 좋은 model이라고 보면 됩니다.
Q2. 왜 다들 Gemini 3 benchmark 얘기를 그렇게 많이 해요?
→ 각종 LM arena leaderboard, Humanity’s Last Exam, Math Arena 같은 benchmark에서 상위권을 휩쓸고 있기 때문입니다. 다양한 task에서 consistently 좋은 성능을 내는 model은 드문 편이라, 연구자와 builder들 사이에서 관심이 크게 집중된 상태입니다.
Q3. 이 정도면 AGI 근처까지 온 건가요?
→ 아직은 아닙니다. Gemini 3 Pro는 pattern recognition과 reasoning 능력이 전에 비해 크게 향상된 model이지만, “의식이 있다”거나 “스스로 목적을 세운다”는 의미의 AGI와는 거리가 있습니다. 다만 tool과 agent를 엮는 방식 때문에 체감 지능이 훨씬 높게 느껴지는 건 사실입니다.
Q4. Anti-gravity는 정확히 뭐 하는 툴이에요?
→ Google이 새로 내놓은 agentic coding platform입니다. 겉으로 보면 VS Code fork처럼 생겼지만, 내부적으로는 Gemini 기반 code agent들이 plan → edit → refactor → test까지 상당 부분 자동으로 처리해 주는 IDE라고 생각하면 됩니다. 우리는 그 결과물을 review하고 방향을 잡아주는 manager of agents 역할을 하게 되죠.
Q5. Windsurf랑은 어떤 관계인가요?
→ 예전에 Windsurf라는 dev environment를 만들던 co-founder들이, Windsurf tech에 대한 non-exclusive license를 들고 약 2.4B 달러 규모의 딜로 Google에 합류했습니다. 이번 anti-gravity가 그 팀이 주도한 결과물이고, 데모 중에 예전 agent 이름인 **“Cascade”**가 그대로 노출된 걸 보면, Windsurf DNA가 꽤 많이 녹아 있는 것으로 보입니다.
Q6. “Chad”라는 brain-rot IDE는 뭐예요?
→ Y Combinator가 지원하는 IDE로, 컨셉이 아주 솔직합니다. TikTok, Tinder, mobile game 같은 brain-rot device를 쓰면서도, background에서 AI agent가 code 작업을 계속 진행해 주는 agentic IDE입니다. 반쯤 농담 같지만, 실제로 agent-first dev workflow를 실험하는 serious product이기도 합니다.
Q7. idx는 사라진 건가요? Firebase Studio는 또 뭐죠?
→ 기존의 idx는 지금 사실상 그 형태를 잃고, Firebase Studio라는 이름으로 재정렬된 상태입니다. Firebase Studio는 app development 전체 lifecycle을 AI agents로 가속하는 platform을 지향하고 있고, 이것 역시 Google이 agentic development에 꽤 진지하게 들어왔다는 신호로 볼 수 있습니다.
Q8. Coding 기준에서 Gemini 3 Pro vs Claude Sonnet 4.5, 어떻게 보나요?
→ 세부적인 비교는 use case마다 다르겠지만, 하나의 강력한 신호는 AMP처럼 실전에서 Claude Sonnet 4.5를 쓰던 서비스가 Gemini 3 Pro로 완전히 갈아탔다는 사실입니다. 그 정도 비용과 리스크를 감수하고도 교체했다는 건, coding task에서 Gemini 3 Pro가 적어도 상당 부분 우위에 있다는 뜻으로 읽힙니다.
Q9. 지금 당장 anti-gravity나 Chad 같은 agentic IDE를 써야 할까요?
→ “써야 한다”까지는 아니지만, 테스트해 볼 가치는 충분히 있습니다. side project나 non-critical한 repo에 먼저 적용해 보면서, agent behavior와 diff 품질을 체감해 보고, 괜찮다고 느껴지면 메인 workflow에 천천히 섞어 넣는 방식이 좋습니다.
Q10. AI agent가 결국 developer를 완전히 대체할까요?
→ 가까운 미래에는 그럴 가능성이 낮습니다. agent가 code generation, refactoring, migration에는 매우 강하지만, 애매한 요구사항을 정리하고, product 방향을 잡고, long-term architecture를 설계하는 일은 여전히 인간의 역할입니다. 오히려 developer는 system designer + reviewer + product thinker 쪽으로 진화하게 될 가능성이 더 큽니다.
Q11. Mobin.com 같은 서비스는 이 그림에서 어떤 역할을 하나요?
→ Gemini 3 Pro나 agentic IDE가 logic과 code를 밀어주는 쪽이라면, Mobin.com은 UI/UX reference와 design 패턴을 공급하는 쪽입니다. 인기 앱들의 screen, flow, animation을 breakdown한 라이브러리를 제공하기 때문에, “어떤 UI가 실제로 잘 먹히는지”를 빠르게 참고할 수 있습니다. 이 둘을 같이 쓰면, 실행력과 완성도를 동시에 끌어올리기 좋아요.
Q12. 이 AI-heavy 시대에 내 커리어를 어떻게 준비하는 게 좋을까요?
→ 요약하면, AI와 경쟁하지 말고 AI 위에 쌓이는 쪽을 선택하는 게 좋습니다.
- 단순한 호출이 아니라, agent orchestration과 workflow design 감각 기르기
- product sense와 UX intuition을 의식적으로 훈련하기
- architecture, trade-off, scaling을 아는 systems thinking 익히기
- 하나의 model에 올인하지 말고, 다양한 tool과 IDE를 실험하는 습관 들이기
이렇게 가면, benchmark 순위가 어떻게 바뀌든,
당신은 그 위에서 “무엇을 만들 것인가”를 결정하는 사람으로 남을 가능성이 큽니다.