반응형

전체 글 3105

Sparse ViT로 고해상도 이미지를 빠르게 처리하는 법: Window Activation Sparsity 완벽 가이드

TL;DR스마트폰으로 100‑megapixel 사진이 일상인 시대입니다. 픽셀이 많아지면 모델이 학습하는 시각 표현도 풍성해지지만, 자율주행 같은 resource‑constrained 환경에서는 비용이 치솟습니다. Sparse ViT는 해상도를 그대로 두고 중요한 window만 계산합니다. 결과적으로 latency는 약 1.5× 감소, MACs는 0.8–1.8× 절감하면서 정확도는 유지하거나 거의 손실이 없습니다. 비결은 window 단위 activation sparsity, 계산이 가벼운 L2 norm 기반 중요도 스코어, 그리고 **Sparsity‑Aware Adaptation(SAA)**으로 보정된 evolutionary search가 stage별 sparsity ratio를 똑똑하게 찾아준다는 점..

SW/인공지능 2025.12.08

VoxelMorph 비지도 Medical Image Registration 완벽 가이드: MRI 뇌영상 정합 원리부터 구현까지

의료 영상 정합, 쉬운 비유에서 정확한 정의까지살짝 비뚤어진 두 장의 사진을 떠올려보세요. 회전과 크기 조절로 경계를 딱 맞추면 속이 다 시원하죠. 의료 영상도 원리는 비슷합니다. 다만 대상이 3D 볼륨이고, 맞춰야 할 대상이 해부학 구조라서 훨씬 더 치밀해야 합니다.정확히 말하면, fixed 이미지 F와 moving 이미지 M이 있을 때, M을 해부학적으로 F와 일치시키는 변환을 구합니다. 이 변환을 deformation field로 표현합니다. 쉽게 말해, M의 각 voxel이 어디로 얼마나 이동해야 F의 올바른 위치에 닿는지 알려주는 아주 촘촘한 3차원 화살표 지도입니다. Deformation field 한 장 요약각 voxel에는 이동 방향과 크기를 담은 벡터가 붙습니다.이동·회전·확대 같은 a..

SW/인공지능 2025.12.07

Speculative Decoding 완벽 가이드: LLM inference 속도 높이고 품질 유지하는 방법

Speculative Decoding: 트랜스포머 모델 속도와 효율을 다시 생각하다AI의 발전 속도는 눈부시다. 해마다 모델은 더 커지고, 복잡해지며, 그만큼 강력해진다. 하지만 여전히 한 가지 제약은 남아 있다. 바로 autoregessive transformer 구조의 본질적인 한계다. 이 구조는 텍스트를 순차적으로 처리해야 하기에, 한 번에 하나의 token만 생성할 수 있다. 내부 연산은 병렬화가 가능하지만, token 생성만큼은 순차적인 흐름을 벗어나지 못한다. 결과적으로 token 수가 늘어날수록 연산량이 폭발적으로 증가하고, 거대한 모델일수록 속도가 발목을 잡힌다.이 문제를 근본적으로 다시 바라본 아이디어가 바로 Speculative Decoding이다. 2023년 ICML에서 처음 제안된 ..

SW/인공지능 2025.12.06

Cursor 2.0 Composer 실제 속도 체감 후기: Claude·GPT-5와 비교한 병렬 에이전트 워크플로

Cursor 2.0 리뷰: 손에 착 붙는 AI IDE, 더 빠른 Composer, Git worktree 병렬 에이전트, 그리고 Chrome DevTools 내장 브라우저까지 어제 Cursor 2.0이 공개됐습니다. Vibe 엔지니어들과 VS Code 파워 유저들 사이에서 늘 화제였던 그 포크가 이번엔 한층 날카로워졌죠. Composer라는 새 모델, agent view의 UI 정비, Git worktree를 활용한 병렬 에이전트 워크플로, 그리고 Chrome DevTools까지 그대로 들어온 native browser. 요약하면, 이제 정말 “여러 에이전트를 동시에 굴려서 코드를 밀어붙이는” 그림이 실무적으로 가능해졌습니다.스폰서는 아닙니다. 다만 지난 1년, Cursor의 급상승은 부정하기 어렵죠..

일상/IT 2025.12.05

QA가 DevOps로 전환하는 법: Shift-Left와 Ephemeral Environments 실무 가이드

QA → DevOps → DevSecOps: 2025 커리어 플레이북 (Rody 인터뷰 풀브레이크다운·로컬라이즈드 버전) Introduction: 불편한 사실, 그리고 커리어 기회“전통적인 QA는 사실상 끝났다.”과격하게 들리지만, 맥락을 보면 담담한 현실 진단입니다. 배포 속도는 더 빨라지고, 파이프라인은 일의 중심이 됐습니다. AI는 테스트 코드 초안과 UI 비교 같은 루틴을 순식간에 처리합니다. 남는 가치는 전략·아키텍처·통합·판단—튜토리얼로 흉내 낼 수 없는 영역이죠.이 글은 한 사람의 실전 전환기를 바탕으로 한 실무 로드맵입니다. 13년 차 Rody가 Test Automation 위에 DevOps를 얹고, Shift‑Left 환경을 Ephemeral Environments로 구현해 못 잡던 프..

SW/면접 2025.12.04

FastAPI로 JWT Authentication과 ImageKit 업로드까지 구현하는 방법 (SQLAlchemy async + Streamlit 실전)

FastAPI로 만드는 실전급 백엔드: Auth, Database, Image/Video 업로드, Streamlit 프론트까지 한 번에 이 글에서 얻어갈 것 — “진짜 돌아가는” 앱을 만들며 배우는 FastAPI이 글은 FastAPI로 사진/동영상 공유 앱을 처음부터 끝까지 조립해 보며 핵심을 익히는 실전 가이드입니다. JWT authentication, 권한 체크, SQLAlchemy (async) + SQLite (aiosqlite), 깔끔한 CRUD, ImageKit 기반 파일 업로드, 그리고 결과를 바로 만져볼 수 있는 Streamlit UI까지. 장난감 예제가 아니라, 프로덕션을 겨냥한 구성요소를 통째로 연결해 봅니다.전제: 기본적인 Python 문법은 알고 있다는 가정하에 진행합니다. API..

SW/Python 2025.12.03

2025년 어떤 Programming Language를 배워야 할까? 목표별 선택 가이드 (초보·전환자 필독)

2025년에 배울 Programming Language, 답은 “목표 먼저” 한눈에 보기 (TL;DR)아무 언어나 덥석 집지 마세요. 가려는 곳을 먼저 정한 뒤 **차량(언어)**을 고르세요. 눈앞에 보이는 UI를 빨리 만들고 싶다면 JavaScript/TypeScript. AI/ML·data·backend 쪽이면 Python. 대기업·레거시가 많은 곳에서 안정적으로 커리어를 쌓고 싶다면 C#/.NET 또는 Java. 현대적 cloud·microservices라면 Go. native mobile은 Kotlin(Android) / **Swift(iOS)**가 정공법. 실전 WordPress 수요를 노린다면 PHP를 과소평가하지 마세요. 낮은 레벨에서 성능·안전을 잡고 싶다면 Rust. 그리고 무엇을 하든..

SW/면접 2025.12.02

10분 만에 Python으로 AI Agent 만드는 방법 (LangChain & LangGraph 완전 가이드)

10분 만에 Python으로 AI Agent 만들기 – 완전 실전 가이드단 10분 만에 나만의 AI Agent를 직접 만들어본다면 어떨까요? 데이터를 생성하고, 파일에 저장하고, 명령에 따라 움직이는 나만의 지능형 도우미를 만드는 과정—지금부터 함께 해보죠.이번 글에서는 LangChain과 LangGraph를 활용해 Python 기반 AI Agent를 만드는 전 과정을 친절하게 정리했습니다. 초보자든 숙련 개발자든 상관없습니다. 따라 하기만 하면, 생각보다 훨씬 빠르게 완성할 수 있을 거예요. Step 1: 개발 환경 준비하기먼저 코드 에디터를 열어주세요. 저는 PyCharm을 사용합니다. Python 프로젝트에 특화되어 있고 인터페이스도 깔끔하거든요. 하지만 VSCode나 Sublime, 어떤 IDE..

SW/Python 2025.12.01

Python match/case, dataclass, positional-only 완전 이해: 실전 예제로 배우는 modern Python 가이드

잘 안 쓰지만 쓰면 삶이 편해지는 Modern Python 기능: match/case, Data Classes, 그리고 Positional‑Only & Keyword‑Only Parameters 한 줄 요약match/case: 장황한 if/elif 사다리를 깔끔하게 정리하고, “값”뿐 아니라 패턴도 매칭합니다.@dataclass: __init__, __repr__, __eq__ 같은 boilerplate를 자동으로 만들어서 데이터 모델링을 빠르게.Positional‑Only & Keyword‑Only Parameters: /와 *로 함수 시그니처의 사용 방식을 명확히 강제해서 API 호환성을 지킵니다.읽고 나면 “아, 이거 왜 이제야 썼지?” 싶은 기능들만 골랐어요. 왜 지금 이 기능들인가?코드는 읽..

SW/Python 2025.11.30

2025 vs 2022 소프트웨어 개발 변화 총정리: AI 코드 생성, CI/CD, staging 비교 가이드

2025년의 Software Development, 정말 2022년과 달라졌나?LLM과 AI가 개발을 뒤흔들었다는 주장, 얼마나 사실일까? 2025년과 2022년을 비교하며 AI code generation, Stack Overflow의 가치, modern deploy, 그리고 fundamentals의 중요성을 한국 개발자 관점에서 현실적으로 짚어봅니다. 요약 한 줄 (TL;DR)AI는 강력한 가속기이지만 만능 치트키는 아닙니다. 빠른 code generation 뒤에는 vibe‑coding, 숨은 tech debt, 얕은 이해 같은 새로운 리스크가 따라옵니다.프로덕션으로 가는 기본 프로세스는 한순간에 뒤집히지 않았습니다. staging, container, CI/CD, one‑command deplo..

일상/IT 2025.11.29

오픈소스 해방 전선: Libra/Libriophone 비전과 모바일 자유 전쟁 (로컬라이즈 버전)

한눈에 보기 (TL;DR)2025년 10월 16일, **Free Software Foundation(FSF)**가 흔히 Libra phone/Libriophone으로 불리는 새 이니셔티브를 발표. 목표는 현대 스마트폰의 모든 proprietary blob을 완전한 free software로 교체하는 것.겉으론 “오픈”이라 부르는 Android를 실전에서도 자유롭게 쓰게 만들기: boot firmware부터 driver, service까지 가능한 한 모든 계층을 공개·감사 가능하게.난이도는 극강. camera pipeline, Wi‑Fi, GPS, modem, GPU driver, TEE 등 핵심 부품이 vendor binary에 묶여 있음.과거 Replicant가 “기술적 가능성”은 증명했지만, 기능 손..

일상/IT 2025.11.28

AI 코딩, 더 이상 고통스럽지 않게: 2025년에 꼭 써야 할 7가지 Model Context Protocol(MCP) Server

2025년, AI 코딩에 대한 솔직한 체감지난주, 아주 특정한 문제를 해결해 줄 작은 software를 찾다가 10달러짜리 완성품을 발견했어요. 그런데 엔지니어의 자존심이 발동했죠. 돈을 안 내고, 3일을 태워가며 Claude credits 500달러를 날리고, 주말엔 애들 야구 경기도 놓친 채 더 구린 버전을 직접 만들었습니다. 네, 자해 플레이다 싶었어요.요즘 개발자는 기묘한 시대를 살고 있어요. 어떤 사람은 생산성이 오히려 떨어졌다며 AI를 아예 멀리합니다. 유명 스트리머 Coding Garden 같은 이들이 각종 그로스 해킹을 한 방에 박살내는 영상도 올리죠. 솔직히 말해 재미없습니다. 전혀요.반대로 올인해서 전례 없는 생산성을 체감하는 팀도 많습니다. NVIDIA는 전 직원이 AI‑enabled..

SW/인공지능 2025.11.27

AI와 Machine Learning 차이를 한 번에 정리: Netflix 예시로 쉽게 이해하는 핵심 가이드

AI · Machine Learning · Neural Networks · Deep Learning — 한 번에 깔끔하게 이해하기Symbolic AI와 Machine Learning의 차이, Supervised / Unsupervised / Reinforcement Learning 비교, Neural Networks와 Deep Learning의 핵심, AlphaZero vs Deep Blue, 그리고 왜 GPU와 Big Data가 게임 체인저였는지까지 한 번에 정리. 들어가며: 헷갈리는 용어들을 한 장에 정리해 드립니다요즘 어디를 가도 AI, Machine Learning, Neural Networks, Deep Learning이란 말이 쏟아집니다. 거기에 Supervised / Unsupervised..

SW/딥러닝 2025.11.26

바닐라 JavaScript로 만드는 Ambient Audio Mixer 실전 튜토리얼: OOP 설계, Preset, Timer까지

Ambient Audio Mixer — Vanilla JavaScript로 만드는 오디오 믹서 완전 가이드 (Tailwind, Presets, Timer, Vercel 배포까지)이 글은 YouTube에 공개된 전체 프로젝트 흐름을 토대로, Vanilla JavaScript + HTML5 Audio API로 Ambient 오디오 믹서를 처음부터 끝까지 만드는 과정을 한국어 감성으로 풀어쓴 실전 가이드입니다. React / Next.js로만 달려오다 잠깐 숨 고르듯, DOM과 class 기반 OOP, 모듈 구조의 기본기를 탄탄히 다져보죠. 실습용 template와 final 구조, 그리고 Vercel 배포까지 한 번에 정리합니다. 왜 이 프로젝트인가?최근엔 framework 중심 개발이 보편화되어, sta..

SW/JavaScript 2025.11.25

ICLR 2024 Eureka 완전정리: LLM으로 Reward Design 자동화하고 Dexterous Manipulation 성능 끌어올리는 방법

ICLR 2024 ‘Eureka’: LLM으로 Reward Design을 자동화해 로봇 조작을 끌어올리다ICLR 2024에 발표된 Eureka를 한국어 시각에서 풀어쓴 가이드. 환경 소스 코드를 LLM이 직접 읽고 Reward Function을 생성·개선해 사람 전문가를 앞서는 성능을 내는 방법을 소개합니다. SayCan, ProgPrompt, Language‑to‑Reward(L2R)와의 차이, Sample Efficiency, 한계와 후속 연구(Dr. Eureka)까지 담았습니다. 한 줄 요약Eureka는 환경 소스 코드를 그 자체로 컨텍스트로 삼아 LLM이 Reward Function을 ‘코드로’ 작성하게 하고, 학습 결과를 되돌려주는 Reward Reflection + Evolutionary S..

SW/딥러닝 2025.11.24

프로덕션 환경에서 통하는 Python 디자인 원칙 정리: production-grade 코드 작성 가이드

프로덕션급 Python 쓰기: 8가지 Design Principle을 감으로 이해하는 로드맵프로덕션 환경에서 통하는 Python 코드를 쓰려면 무엇이 달라야 할까? 이 글은 senior 개발자가 반드시 챙기는 8가지 design principle—cohesion & single responsibility, encapsulation & abstraction, loose coupling & modularity, reusability & extensibility, portability, defensibility, maintainability & testability, simplicity(KISS/DRY/YAGNI)—을 한국 개발자 감성에 맞게 풀어 설명합니다. 실제로 써먹을 수 있는 예시와 현업 관점의 체크리..

SW/Python 2025.11.23

API rate limiting 실전 가이드: Token Bucket vs Fixed Window, 무엇이 더 공정한가

Token Bucket, 429, 공정한 트래픽 제어의 기술 (2025 로컬라이즈드 가이드)과속을 막되, 흐름은 살려라. 좋은 rate limiter는 벽이 아니라 게이트다. 정당한 요청은 매끄럽게 통과시키고, 폭주는 부드럽게 제동한다.현업에서 여러 스택과 팀을 거치며 rate limiting을 설계·운영해 왔다. 이 글은 그런 시행착오를 걷어낸 실전 가이드다—쉽게 읽히고, 바로 써먹기 좋게. 가끔은 개발자 냄새(좋은 의미!)가 나는 소소한 TMI도 곁들인다.한 줄 요약: Rate limiting은 거절의 기술이 아니라, “지속 가능한 예스”를 설계하는 일이다. TL;DR (먼저 답부터)정책 예시: 사용자별 100 req/min 같은 한도를 configurable rule로 관리.오버 리밋 처리: HT..

Warp 사용법 완벽 가이드: Terminal-first Agent Development Environment로 FastAPI·React 앱 빠르게 만드는 법

Warp, Vibe Coding, 그리고 Agent 시대: 2025 로컬라이즈드 실전 가이드한 줄 요약: Warp는 Agent Development Environment(ADE)—즉 terminal, IDE, 그리고 AI agent를 한 화면 안에서 엮어주는 작업 공간입니다. prompt → plan → execute → review → iterate 흐름을 끊김 없이 이어 주고, 대형 코드베이스와 실제 배포까지 염두에 둔 성능/문맥 이해력이 강점입니다. 왜 지금 Warp인가?이 글은 “처음 코딩을 접하는 사람”과 “매일 코드를 배포하는 개발자”가 같이 읽어도 손이 먼저 움직이게 만드는 실전형 안내서입니다. 창을 이리저리 옮겨 다니지 않고, 한 곳에서 프롬프트 작성 → 계획 수립 → 코드/명령 실행 →..

SW/인공지능 2025.11.21

Sora 2 오디오 지원과 물리 일관성 완벽 정리: sora.com 소셜 UX까지 한 번에 이해하기

Sora 2 vs Vibes: 끝없이 돌리는 AI 비디오 슬롯머신의 시대AI가 불안한 분들에겐 험한 하루, Sam Altman 소식에 목마른 분들에겐 축제. OpenAI가 Sora 2를 공개했습니다. 물리 일관성, 현실감, 제어력이 한 단계 올라갔고, 결정적으로 오디오가 기본 탑재됐습니다.저도 invite code가 없어 eBay에서 구입했습니다(현생 친구 없음 인증…). 그런데 값어치는 확실했어요. 지난 24시간 동안 하이퍼 퍼스널라이즈드 클립들이 도파민 회로를 사정없이 갈아넣더군요.2년 전 모두를 웃겼던 그 윌 스미스 스파게티 영상 기억하시죠? 그땐 티가 났기에 웃을 수 있었죠. 1년 뒤엔 분위기가 달라졌고, 올해는 경계가 더 얇아졌습니다. Sora 2는 오디오 + 더 나은 물리 + 정교한 제어로 이..

SW/인공지능 2025.11.20

알리바바 ASI 로드맵 완전 정리 — Quen 3, 520억 달러 투자, 2032 목표의 의미

알리바바의 ASI 3단계 질주: Absara 2025, Quen 3, 그리고 “AI 시대의 Android” 플레이북한 줄 요약: 알리바바가 대놓고 이렇게 말한 셈이다 — “우린 인공지능의 운영체제가 될 거야.”카페에서 식어버린 커피를 홀짝이며 Absara 키노트와 자료를 끝까지 훑었다. 평범한 제품 발표가 아니었다. 2032년이라는 빨간 동그라미까지 찍힌 ASI(Artificial Super Intelligence) 로드맵. 과감하고, 약간은 오만해 보이지만… 속도는 진짜다. 바퀴가 자갈을 밟을 때 나는 그 불안한 속도감 말이다.이 글에선 알리바바의 큰 그림을 한국 독자 감성에 맞게 풀어 쓴다. 모델 스펙은 쉬운 비유로, 의도는 일상 언어로. 그리고 마지막엔 “그래서 우리 일에 뭐가 달라지는데?”를 정리..

SW/인공지능 2025.11.19
반응형