반응형

SW/인공지능 298

불균형 데이터셋 문제, AutoBalance로 해결하는 머신러닝 로스 최적화 전략

AutoBalance: 불균형 데이터를 다루는 따뜻하고도 똑똑한 해법AutoBalance는 클래스·그룹 불균형 문제를 자동화된 bi‑level 최적화로 해결합니다. Parametric Cross‑Entropy, 맞춤형 데이터 augmentation, Balanced Error Rate 등 최신 기법을 통해 공정성과 정확도를 동시에 끌어올리는 법을 살펴보세요.  왜 ‘불균형’이 문제일까? “불량품은 0.5%밖에 안 나오니까 별로 중요하지 않겠지?” 라고 생각했다가 AI 모델이 불량품을 줄줄이 놓치는 최악의 상황, 상상해 보셨나요? imbalanced dataset는 이렇게 ‘적게 보이는’ 클래스를 순식간에 투명 인간으로 만들어 버립니다. 더 큰 문제는 fairness—편향된 결과가 사회적 약자를 한 번..

SW/인공지능 2025.07.08

무료 Google Gemini CLI 설치 방법 완전 정복: Node.js만 있으면 되는 초간단 가이드

구글 무료 Gemini CLI를 120% 활용하는 법 – 호기심 많은 창작자와 야심 찬 개발자를 위한 완벽 가이드포커스 키프레이즈: 무료 Google Gemini CLI 튜토리얼“돈 내고 GPT 쓰던 시대는 갔다. 이제 터미널만 열면 공짜 AI가 대기 중!” — 2025년 7월, 절약을 사랑하는 코리안 디벨로퍼 1. 빅뉴스! Google이 Gemini 추론 모델을 완전 무료로 풀었다한국 IT 커뮤니티엔 이런 밈이 돌았다. “대한민국은 GPT 구독료 세계 1위!”하지만 Google이 슬쩍 Gemini inference의 결제 벽을 없앤 순간, 그 밈은 하루 만에 고대 유물이 됐다. 하루 1,000회 요청이면 사실상 무제한. 신용카드도, 구독 결제 알람도 필요 없다. 프롬프트만 치면 AI가 응답한다. ‘G..

SW/인공지능 2025.07.06

Gemini CLI로 AI 코딩 자동화 시작하는 방법: 하루 1,000회 무료!

Gemini CLI: 당신의 터미널을 바꿔 놓을 무료 & 오픈소스 AI 코딩 친구 — 하지만 Google이 또 조기종영할까?1,000회 무료 호출이 가능한 Gemini CLI로 비용 부담 없이 AI 코드를 생성하고 실행해 보세요. Claude Code, OpenAI CodeX와 비교 분석, 실제 사용 후기까지 한눈에 확인! 2025년 6월 30일 — 새로운 터미널 매직의 서막무더운 6월의 마지막 화요일 저녁, 조용히 쉘을 열어 사이드 프로젝트를 만지작거리던 당신 앞에 Google이 폭탄을 투척했다. Gemini CLI가 정식으로 커맨드라인에 모습을 드러내며, 이제 AI에게 내 컴퓨터의 모든 권한을 통째로 맡길 수 있게 된 것이다. 코드 작성, 테스트, 파일 생성, 명령어 실행… 그동안 개발자 월급을 먹여..

SW/인공지능 2025.07.05

Chain-of-Agents란? 롱컨텍스트 LLM 성능을 10% 이상 끌어올린 혁신

롱컨텍스트 시대의 판도를 바꾸는 혁신, Chain-of-Agents (COA): NeurIPS 2024 발표 논문 리뷰요즘처럼 대형 언어 모델(Large Language Models, LLMs)이 점점 더 방대한 정보와 복잡한 맥락을 다뤄야 하는 시대에, 긴 문서를 제대로 처리하지 못한다는 건 치명적인 약점이 될 수 있습니다. 바로 이 문제를 정면으로 해결하고자 등장한 방식이 바로 'Chain-of-Agents(COA)'입니다. 이 혁신적인 프레임워크는 펜실베이니아 주립대와 구글 클라우드 AI 리서치가 함께 개발했고, 2024년 6월에 논문이 공개되었으며 NeurIPS 2024에서 발표되었습니다.그럼 COA가 왜 지금까지의 한계를 뛰어넘는 방식인지 하나씩 살펴보겠습니다. COA란 무엇인가요?COA는 여..

SW/인공지능 2025.07.04

Warp AI 터미널 사용법: 음성·자연어로 FastAPI·Docker 프로젝트 뚝딱 만드는 법

타이핑은 그만! Warp AI 터미널로 여는 Prompt‑Coding 시대음성이나 자연어 입력만으로 Python, FastAPI, Docker 프로젝트를 뚝딱 만드는 Warp 터미널의 실제 사용법을 살펴보며, 코드 생산성을 폭발적으로 끌어올리는 핵심 팁을 소개합니다. 손으로 짜던 코드, 서서히 퇴장 중 – 살아남으려면 ‘프롬프트’로 말하라어제 저녁, 두 번째 유니콘을 준비 중인 시니어 엔지니어 친구를 만나 커피를 마셨습니다. 그의 모니터는 의외로 한가로워 보였죠. 키보드 소리는 거의 없고, 세 줄 남짓한 터미널 창과 마이크 아이콘만 깜빡입니다. 그는 한 분 남짓 되는 긴 문장을 AI에게 “말”로 전달했고, 몇 초 뒤엔 완성된 모듈이 깃 커밋에 등장했습니다. 무려 **코드의 90 %**가 기계에서 나왔..

SW/인공지능 2025.07.03

Taskmaster AI로 개발 생산성 10배 올리는 법 (VS Code에서 바로 써보기)

Taskmaster AI 체험기: 개발자 인생 바꿔준 오픈소스 매니저 개발하다가 멘붕 올 때, Taskmaster AI가 답이더라개발 아이디어는 넘치지만, 정리와 계획이 귀찮고 어렵다.Taskmaster AI는 프로젝트 매니저처럼 체계적으로 정리해준다.오픈소스이며 VS Code 등에서 쉽게 사용할 수 있다. 여러분, 다들 한 번쯤 이런 경험 있지 않나요? 머릿속에 기가 막힌 아이디어가 떠올라서 당장 코드 치고 싶은데, 막상 뭘 해야 할지 정리가 안 돼서 멍… 계획 짜는 것도 귀찮고, 작업을 어떻게 나눌지 막막하고, AI한테 뭘 시켜야 하는지도 모르겠고요.저도 늘 그랬거든요. 근데 우연히 Taskmaster AI라는 걸 알게 됐어요. 이게 뭔가 했더니, 그냥 코드 짜는 도우미가 아니라 진짜 프로젝트 매니..

SW/인공지능 2025.07.03

Python으로 LLM Fine-Tuning 쉽게 시작하기: Unsloth + Ollama 완벽 가이드

Python과 Unsloth & Ollama로 LLM Fine‑Tuning 완전 정복 🚀한눈에 보는 요약 – Fine‑Tuning은 경력 20년 셰프에게 우리 집 레시피를 전수해 완벽 재현하게 만드는 작업입니다. 이 가이드에서는 데이터 모으기 → Google Colab 무료 GPU 연결 → Unsloth로 LoRA 어댑터 장착 → 몇 분 만에 학습 → Ollama에 실어 로컬에서 돌리는 전 과정을 쫀쫀하게 알려드려요. ☕️ 왜 이 글을 써야 했을까? 🤔국내 자료를 찾다 보면 깊이와 친근함 중 하나를 포기해야 할 때가 많죠? 저는 둘 다 잡았습니다. 이 글은:실전 코드만 다룹니다. 2025년에도 바로 돌아가는 셀만 수록했어요.대화체로 진행해 어려운 개념도 술술 읽힙니다.SEO도 챙겼습니다. 롱테일 키..

SW/인공지능 2025.07.02

Native Sparse Attention으로 64K 토큰 디코딩 속도 1.8배 올리는 법

Native Sparse Attention(NSA): 긴 컨텍스트 LLM을 날렵하게 만드는 비결NSA는 64K‑token 입력을 번개처럼 처리하면서도 정확도를 지키는 하드웨어 친화 Sparse Attention 기법입니다. 긴 문서를 빠르게 다루고 싶은 개발자를 위한 필독 가이드! 1. 왜 긴 컨텍스트가 요즘 AI의 핵심인가요?200페이지 계약서를 한 번에 읽고 요약하거나, 거대한 코드베이스를 통째로 리팩터링하려면 모델이 많은 토큰을 단숨에 삼켜야 합니다. GPT‑5, DeepSeek‑R1, Gemini Pro가 바로 그런 ‘대식가’죠. 하지만 Sequence 길이가 길어질수록 Attention 연산량은 제곱으로 불어나고, GPU 팬은 비행기 이륙 소리를 냅니다. 2. Full Attention의..

SW/인공지능 2025.07.01

코딩 초보도 할 수 있는 3가지 AI 프로젝트: 챗봇, GPT 이력서 분석, 이미지 인식 앱

“AI? 나도 한번 만들어볼 수 있을까?” 저도 처음엔 엄청 막막했어요. 파이썬은 좀 만져봤지만, AI는 너무 멀게만 느껴졌거든요. 그런데 진짜 놀랍게도, 생각보다 쉽게 시작할 수 있었어요.여기 소개하는 3가지 AI 미니 프로젝트는 딱 ‘처음 해보는 사람’에게 맞춰져 있어요. 어렵지 않게 따라 할 수 있고, 하나하나 만들다 보면 자신감도 쑥쑥 붙어요.나랑 대화도 하고 계산도 해주는 똑똑한 AI 챗봇이력서를 업로드하면 피드백을 주는 AI 이력서 분석기사진만 올리면 무엇인지 알려주는 이미지 분류기 필요한 건? 파이썬 기초 지식과 약간의 호기심! 너무 겁먹지 마세요. 사용 도구는 LangChain, Streamlit, TensorFlow, OpenCV, 그리고 요즘 진짜 빠르다고 소문난 UV라는 툴이에요.자,..

SW/인공지능 2025.07.01

Stable Diffusion으로 단안 Depth 추정! Marigold diffusion 기반 monocular depth estimation 완전 해부

Latent Diffusion이 열어 준 단안(單眼) Depth Estimation의 새로운 길“이미지를 ‘그리는’ 모델이, 그 그림 속 3D 구조까지 자연스럽게 ‘읽어낼’ 수 있다면 어떨까요?”Marigold는 바로 이 질문에서 출발했습니다. Depth Estimation(깊이 추정)은 평면 사진에 숨어 있는 거리감을 끌어내는 작업입니다. Stereo Vision처럼 카메라 두 대가 필요한 것이 보통이지만, Monocular Depth Estimation은 한 장짜리 RGB 이미지로 승부수를 던집니다. 문제는 환경이 조금만 바뀌어도 성능이 요동친다는 점이죠. 연구진은 그 이유를 ‘시각적 경험치 부족’에서 찾고, Stable Diffusion의 막대한 visual prior를 빌려와 해법을 제시합니다. ..

SW/인공지능 2025.06.30

스테이블 디퓨전으로 영상 만들기: 초보도 가능한 제로샷 기법

제로샷 텍스트 투 비디오: 말 한마디로 영상이 뚝딱?AI가 영상을 만든다고? 직접 써봤어요생성형 AI가 이미지에서 영상까지 가능하다는 점에서 놀라움을 줌‘제로샷 텍스트 투 비디오’는 텍스트 한 줄만으로 영상 생성 가능별도의 학습 과정 없이도 움직이는 장면 생성이 가능해 사용자 입장에서 매우 매력적임 요즘에 생성형 AI 정말 핫하잖아요? 글 한 줄만 써도 멋진 그림이 나오는 걸 보고 완전 놀랐었는데요, 그게 영상으로 이어진다고 하면 어떠세요? 처음엔 저도 반신반의했죠. 그림이야 정지된 이미지니까 가능하겠지만, 움직이는 장면을 만든다니? 그건 진짜 어려운 거 아닌가요?근데 그걸 진짜 해낸 팀이 있더라고요. 이진주 연구원님과 팀원분들이 만든 ‘제로샷 텍스트 투 비디오’라는 기술인데요, 이름만 보면 좀 어렵게 ..

SW/인공지능 2025.06.30

Pythagora 사용법 총정리: 음성 프롬프트로 MERN 웹앱 자동 생성하는 방법

Pythagora AI Coding Tool 튜토리얼 – 아이디어부터 배포까지, 코드‑타이핑 레이서 완성하기Focus keyphrase: Pythagora AI coding tool tutorial메타 설명(155 자): 한글 음성 프롬프트를 넣고 Pythagora로 MERN 앱을 완성해 보세요. 이 튜토리얼은 Code‑Typing Racer를 기획부터 클라우드 배포까지 안내합니다. 1. 왜 다시 AI를 믿어 보았을까? 😅4년 전, 실시간 Typing Racer 클론을 만들겠다며 12시간 라이브 코딩 스트리밍을 했습니다. 커피와 땀, 부족한 변수명이 뒤섞인 그 여정은… 실패로 끝났죠. 채팅창엔 응원이, 제 마음엔 좌절이 남았습니다.2025년, Pythagora라는 새 도구가 “specs in sec..

SW/인공지능 2025.06.28

Gemini 2.5 Pro 후기: 코딩 진짜 이렇게까지 잘한다고?

Gemini 2.5 Pro, 이거 진짜 물건이야 — 내가 써본 코딩 AI 중 최고였다고 해도 과언 아님어제였나? 아무 생각 없이 트위터 보다가 갑자기 Google이 Gemini 2.5 Pro를 공개했다는 얘기를 봤어요. 어라? 이거 원래 I/O에서 발표하던 거 아니었어? 싶었죠. 아직 I/O도 열리기 전인데 그냥 내놨다니. 이거 뭔가 더 큰 걸 숨기고 있는 거 아냐? Gemini 3? 아니면 Ultra 버전?근데 그런 거 다 제쳐두고, 지금 나온 2.5 Pro 자체가 장난이 아닙니다. 진짜, 지금까지 써본 코딩 AI 중에서는 단연 톱이에요. LLM Arena에서도 1등 찍었더라고요. 그것도 코딩 쪽에서요. 거기 시스템이 좀 재밌는 게, 어떤 모델이 답했는지 안 알려주고 그냥 결과물만 보고 평가하게 돼 있..

SW/인공지능 2025.06.23

실시간 웹 데이터를 자동으로 가져오는 AI 웹봇 만들기 (MXGp & Bright Data 활용법)

MXGp 서버 써봤는데... 이건 진짜 웹 스크래핑 끝판왕입니다 (개발자 솔직 후기)혹시 AI 에이전트 만들어보셨어요? 저는 처음엔 완전 신났어요. 머리도 잘 굴리고, 계획도 똑똑하게 세우고. 근데 막상 웹에서 진짜 정보 좀 가져오려고 하니까? 갑자기 CAPTCHA에 막히고, 자바스크립트 떡칠된 페이지에 멘붕 오고... 아예 사이트에서 튕겨버리기도 하더라고요.그때 딱 발견한 게 MXGp 서버였어요. 특히 Bright Data에서 제공하는 게요. 이름만 봐선 뭔가 거창해 보이지만, 써보니까 이건 진짜 신세계더라고요. 너무 좋아서 이렇게 정리해봤어요. 설치부터 Python이랑 연결해서 쓰는 것까지, 제가 직접 해본 거 바탕으로 편하게 풀어볼게요.편하게 봐주세요. 우리끼리 얘기하듯이요 :) MXGp 서버,..

SW/인공지능 2025.06.22

LangGraph로 직접 만들어본 AI 챗봇 후기 – 초보도 가능한 실전 개발기

LangGraph로 똑똑한 AI Agent 만들기 - 개발자를 위한 쉽고 직관적인 가이드Meta Description: LangGraph로 직접 AI 챗봇을 만들면서 느낀 솔직한 후기와 사용 팁을 공유합니다. 실전 경험 가득한 개발자의 이야기! 진짜 이 얘기부터 해야겠어요. 요즘 AI 챗봇에 관심 많은 분들 많잖아요? 저도 그중 하나였고요. 근데 맨날 LangChain이 어쩌고, LlamaIndex이 저쩌고 하다 보니 뭔가 내가 직접 흐름을 짜는 건 어렵겠다 싶더라고요. 그러다 우연히 LangGraph란 걸 알게 됐어요. 처음엔 '이건 또 뭐야?' 싶었는데, 와... 써보니까 진짜 이건 게임 체인저예요. “LangGraph는 그냥 챗봇 만드는 게 아니라, ‘이런 상황에선 이렇게 반응해!’라고 내가 직..

SW/인공지능 2025.06.20

월 10달러로 Claude, GPT, 이미지 생성까지? ChatLLM 직접 써본 후기

ChatLLM 써봤는데요, 진심으로 ‘이거 하나면 끝’이라는 말이 실감 났어요요즘 AI 툴, 이것저것 구독하다 보면 나도 모르게 월 10만 원 넘게 쓰고 있더라고요. 저도 한 5~6개 정도 쓰고 있었는데, 정리하려니 막막했죠.그러던 중에 알게 된 게 바로 ChatLLM. 솔직히 처음엔 “또 하나의 AI 플랫폼이겠지 뭐” 하고 넘기려다가, 한 번 써보고 나서는 생각이 완전 바뀌었어요. 월 10달러 하나로 제가 필요로 했던 거의 모든 기능이 들어있더라고요. 창 여러 개 띄울 필요도 없고, 그냥 한 곳에서 다 해결되니까 편하더라고요.아, 이 글은 광고 맞긴 한데요, 직접 써보고 괜찮아서 소개하는 거예요. 제 기준에서는 시간도 아끼고 돈도 아끼게 해줘서 공유하는 거니까, 가볍게 봐주세요! 💸 요금제, 진짜 ..

SW/인공지능 2025.06.14

GPT처럼 이미지를 생성한다고? BAR 모델로 본 최신 AI 이미지 생성 기술

비주얼 오토리그레시브 모델링: 이미지 생성의 새로운 진화최근 인공지능은 두 가지 분야에서 눈부신 발전을 이뤄냈습니다. 하나는 언어 이해, 다른 하나는 이미지 생성입니다. 언어 분야에서는 ChatGPT 같은 도구들이 비약적인 진보를 보였고, 이미지 쪽은 GAN 모델에서 Stable Diffusion, Midjourney 같은 새로운 방식으로 급격한 변화를 맞이했죠. 그런데 이런 질문이 떠오릅니다. 언어 모델, 특히 GPT 방식처럼 효과적인 구조가 이미지 생성에도 적용될 수 있을까요?그 해답이 될 수 있는 새로운 접근법이 바로 '비주얼 오토리그레시브 모델링(VAR)'입니다. 북경대학교와 바이트댄스가 공동 연구한 이 방법은 대규모 언어 모델에서 영감을 받아 이미지를 생성하는 참신한 방식으로 주목받고 있습니다...

SW/인공지능 2025.06.12

DeepSeek R1이 기존 언어 모델과 다른 이유: 체인 오브 쏘트와 GRPO의 힘

DeepSeek R1: 언어 모델 학습의 새로운 지평을 열다DeepSeek R1, 이 모델을 처음 봤을 땐 그냥 또 하나 나왔구나 싶었어요. 그런데 자세히 들여다보니, 이건 뭔가 다르더라고요. 단순히 언어를 예쁘게 만드는 걸 넘어서, 마치 생각을 '하려는' 모델 같달까요?DeepSeek V3를 기반으로 한 이 모델은 사람처럼 더 자연스럽게 사고하고 대답하려는 느낌이 강했어요. 마치 우리가 친구랑 대화할 때 맥락을 이해하고 말 꺼내듯이요. 그 구조도 잘 짜여 있고, 배려가 느껴진달까? 실제 환경에서도 눈에 띄는 성과DeepSeek R1은 다양한 고난이도 데이터셋에서 뛰어난 성능을 보였습니다:ARC-2024: 수학과 논리 문제 위주의 복잡한 질문들.Codeforces 및 SW Bench Verified: 코..

SW/인공지능 2025.06.07

OpenAI o3 Mini와 Codeex 솔직 후기: AI 개발툴 5종 비교 체험기 (Claude, Firebase Studio, Cursor까지)

OpenAI o4 Mini와 요즘 쏟아지는 AI 툴들 이야기: 설렘 반, 혼란 반, 그리고 개발자의 현실 토크2025년 4월 17일, OpenAI가 또 한 방 터뜨렸습니다. ‘o3’과 ‘o4 Mini’라는 모델을 한꺼번에 내놨거든요. 사람들이 하는 말로는 이게 거의 천재급이라나요? 뭐, 천재가 뭔지 모르겠지만, 듣기만 해도 “이제 진짜 영화 같은 세상 오겠구나” 싶긴 해요. 다만, 솔직히 이런 말 한두 번 들어본 것도 아니고, 괜히 기대했다가 실망하기 딱 좋습니다. 그러니까, 살짝 기대하면서도 한 발은 빼놓는 게 현명한 자세 아닐까요?이번에도 역시나 OpenAI의 속도는 미쳤어요. GPT-4.1 출시한 지 며칠 됐다고, 벌써 새로운 모델을 또? Vision이고 뭐고 헷갈릴 지경입니다. 특히 이름들이 너무..

SW/인공지능 2025.06.03

AI 코딩툴 완전 활용법! 작업 자동화에 도움 되는 MCP 서버 8가지

진짜 사람처럼 똑똑한 AI, 나만의 작업 비서가 생긴 느낌이랄까? MCP 서버 8종 찐후기여러분, 상상해보세요. 내가 해야 할 일들을 누가 옆에서 하나하나 척척 도와준다면요? 코드도 짜주고, 회의 노트 정리도 대신해주고, 웹 브라우저 열어서 이것저것 클릭해주고, 유튜브 영상까지 요약해주는 친구요.그게 바로 MCP 서버입니다. 처음엔 좀 생소했는데, 써보니까 "와... 이게 진짜 가능하네?" 싶었어요. 저는 요즘 VS Code랑 Corsor 쓸 때 꼭 같이 씁니다. 이제 그 8가지 MCP 서버, 제가 직접 써본 느낌을 담아서 하나씩 소개해드릴게요. 설치하는 방법은 영상으로 따로 준비돼 있으니까, 궁금하시면 아래 링크도 확인해보세요! 1. Notion이랑 AI가 친구 먹으면 벌어지는 일회의 내용을 AI가..

SW/인공지능 2025.05.30
반응형