Gemini CLI에서 만나는 새로운 차원의 상호작용 구글 인사이트 by Miyeon. Jo 2025년 11월 17일 워크플로를 더욱 강력하고 친숙하게 만들어주는 Gemini CLI의 향상된 기능을 소개하게 되어 기쁩니다. 터미널을 업그레이드하여 편집용 vim, 모니터링용 top, 대화형 git rebase -i 같은 복잡한 대화형 명령을 Gemini CLI 내에서 직접 실행할 수 있도록 했습니다. 더 이상 별도의 터미널로 이동하거나 대화형 명령을 ‘중지’하는 에이전트 CLI를 사용할 필요가 없습니다. 모든 것이 현재 위치에 그대로 유지됩니다. 모든 것을 컨텍스트에 맞추기 이제 모든 작업이 Gemini CLI의 컨텍스트 내에서 이루어지기 때문에 하나의 컨텍스트 안에 유지하는 것이 중요합니다. 이전에는 대화형 셸 명령을 실행하려면 Gemini CLI를 종료해야 했습니다. 더 중요한 것은 이런 명령이 Gemini CLI의 컨텍스트 밖에서 실행되고 있었다는 점입니다.유사 터미널(PTY) 지원을 도입함으로써 텍스트 편집기, 시스템 모니터, 터미널 제어 코드에 대한 의존 같은 고급 기능이 필요한 명령도 이제는 모두 Gemini CLI 내부에서, 그리고 해당 컨텍스트 안에서 실행할 수 있게 되었습니다. 작동 방식: 터미널 상태 직렬화 이제 셸 명령을 실행하면 Gemini CLI는 백그라운드에서 node-pty 라이브러리를 활용해 가상 터미널 내에서 새 프로세스를 생성합니다. PTY는 중개자 역할을 하며, 운영체제가 세션을 터미널로 인식하는 데 필요한 인터페이스를 제공합니다. 이를 통해 애플리케이션과 명령을 자연스럽게 설계된 대로 실행할 수 있습니다.그러면 백그라운드에서 실행되는 이 가상 터미널은 화면에 어떻게 표시될까요? 동영상 스트림이라고 생각하시면 됩니다. Google의 새로운 직렬 변환기는 가상 터미널의 모든 순간을 스냅샷으로 저장합니다. 모든 텍스트, 모든 색, 심지어 커서의 위치까지도 빼놓지 않고 포착합니다. 그런 다음 이러한 스냅샷이 개발자에게 스트리밍되어 실시간으로 터미널 애플리케이션을 보고 상호작용할 수 있도록 합니다. 이는 단순한 텍스트 스트림이 아니라 실시간 피드인 것입니다. 완전한 양방향 상호작용 이 새로운 아키텍처를 통해 양방향 통신을 할 수 있습니다. 터미널에 입력을 전달하는 기능과 실행 중에도 크기를 조정할 수 있는 새로운 기능이 추가되었습니다. 키를 입력하면 해당 키 입력이 실행 중인 프로세스로 전송되고, 창 크기를 조정하면 네이티브 터미널과 마찬가지로 Gemini 셸 내부의 애플리케이션이 자동으로 레이아웃을 조정합니다. Ctrl + F 키를 눌러 터미널에 포커스를 맞출 수 있습니다.또한 다채로운 터미널 출력을 올바르게 렌더링할 수 있도록 출력 처리도 개선했으므로 선호하는 명령줄 도구를 최상의 환경에서 활용할 수 있습니다. 대화형 셸 시작하기 새로운 대화형 셸은 Gemini CLI v0.9.0부터 기본으로 활성화됩니다.다음 명령을 사용하여 최신 버전으로 업그레이드하세요.npm install -g @google/gemini-cli@latest자세한 내용은 공식 Gemini CLI 설명서를 참조하세요.다음은 대화형 셸로 실행할 수 있는 명령 유형의 몇 가지 예입니다.vim, nvim 또는 nano로 코드를 편집합니다.대화형 git 명령으로 커밋을 관리합니다.선호하는 언어에 대화형 REPL을 사용합니다.htop 또는 mc와 같은 전체 화면 터미널 애플리케이션을 실행합니다.npm init 또는 ng new와 같은 대화형 설정 스크립트를 쉽게 탐색합니다.특정 gcloud 명령에 대한 대화형 프롬프트에 응답합니다. 이것은 셸 통합의 주요 단계이며 저희는 모든 플랫폼에서 입력 처리를 개선하기 위해 적극적으로 노력하고 있습니다. 불일치 사항을 발견하시는 경우 GitHub 저장소에 의견을 공유해 주시기 바랍니다. 출처 Gemini CLI에서 만나는 새로운 차원의 상호작용 2025년 11월 17일
비오 3.1 및 플로우의 향상된 크리에이티브 기능을 소개합니다 구글 인사이트 by Miyeon. Jo 2025년 10월 28일 5개월 전 구글은 비오(Veo) 기반 AI 영상 제작 도구인 도구인 플로우(Flow)를 공개한 후, 이용자들이 제작한 약 2억 7천 5백만 개 이상의 크리에이티브한 영상과 이에 대한 뜨거운 관심에 큰 영감을 받았습니다. 그리고 그동안 이용자들의 다양한 피드백을 꼼꼼하게 검토해 본 결과, 플로우 내에서 예술적 완성도를 더욱 높일 수 있는 기능과 함께, 오디오 지원의 확대를 원한다는 점을 확인할 수 있었습니다.이러한 의견을 반영해, 오늘 구글은 이용자가 최종 결과물을 더욱 세밀하게 제어할 수 있도록 클립 편집에 대한 새롭고 향상된 크리에이티브 기능을 소개합니다. 또한 처음으로, ‘소재로 동영상 만들기(Ingredients to Video)’, ‘프레임으로 동영상 만들기(Frames to Video)’, ‘확장(Extend)’과 같은 기존 기능에 오디오 지원을 추가합니다.구글은 이와 함께 풍부한 오디오, 더 다양한 내러티브 제어, 실제와 같은 질감을 표현할 정도로 높은 사실감을 구현하는 비오 3.1(Veo 3.1)도 함께 선보입니다. 비오 3 기반으로 개발된 최신 기술인 비오 3.1은 프롬프트에 대한 정확도가 높아지고, 이미지를 영상으로 전환할 때 오디오와 비디오 품질이 더 향상되었습니다.비오 3 기반으로 개발된 최신 기술인 비오 3.1은 프롬프트에 대한 정확도가 높아지고, 이미지를 영상으로 전환할 때 오디오와 비디오 품질이 더 향상되었습니다.오디오와 강력해진 제어 기능으로 더욱 풍부한 내러티브 완성하기구글은 비오 3.1을 통해, 기존 기능에 오디오를 추가해 더욱 완벽한 장면을 구현해 내도록 지원하고자 합니다. 현재 이러한 기능들은 아직 실험 단계에 있으며, 지속적으로 개선되고 있습니다. 이용자 여러분의 피드백을 바탕으로 앞으로 어떤 멋진 작품이 계속해서 만들어질지 기대됩니다.이제 풍부하게 생성된 오디오를 통해 다음과 같은 작업이 가능합니다. 원하는 장면 연출하기: ‘소재로 동영상 만들기(Ingredients to Video)’ 기능을 이용하면 여러 참조 이미지를 활용해 인물, 사물 및 스타일을 제어할 수 있습니다. 플로우는 이용자가 제공한 소재를 바탕으로 상상했던 모습 그대로의 최종 장면을 만들어 냅니다. 소재로 동영상 만들기(Ingredients to Video)’ 기능을 이용하면 여러 참조 이미지를 활용해 인물, 사물 및 스타일을 제어할 수 있습니다.처음부터 끝까지 장면 컨트롤 하기: ‘프레임으로 동영상 만들기(Frames to Video)’ 기능에 시작 이미지와 끝 이미지를 제공하면, 플로우가 두 이미지를 매끄럽게 잇는 동영상을 생성합니다. 예술적이고 멋진 전환 효과를 연출하는 데 적합합니다. ‘프레임으로 동영상 만들기(Frames to Video)’ 기능에 시작 이미지와 끝 이미지를 제공하면, 플로우가 두 이미지를 매끄럽게 잇는 동영상을 생성합니다.더 길고 매끄러운 설정 샷 만들기: ‘확장(Extend)’ 기능을 사용하면 더 긴 클립을 만들어 분위기를 조성하거나 움직임을 따라갈 수 있습니다. 플로우는 원본 영상의 마지막 1초를 기반으로 새로운 동영상을 생성합니다. 이로 인해 오디오의 연속성은 마지막 1초에 제한되므로, 파도 소리와 같이 배경 오디오를 계속 이어가고 싶은 장면에 가장 효과적입니다. ‘확장(Extend)’ 기능을 사용하면 더 긴 클립을 만들어 분위기를 조성하거나 움직임을 따라갈 수 있습니다. 요소와 동영상을 더욱 정밀하게 편집하기 훌륭한 아이디어는 창작 과정 중 언제든 떠오를 수 있습니다. 첫 시도가 최종 결과물이 아닌 경우를 대비해, 플로우 안에서 직접 장면을 다시 구상하고 완성할 수 있는 새로운 편집 기능을 추가했습니다. 장면에 새로운 요소(elements)를 자유롭게 추가하기: ‘삽입(Insert)’ 기능을 사용하면 사실적인 디테일부터 환상 속의 자연에 이르기까지 상상하는 모든 것을 추가할 수 있습니다. 이제 플로우는 그림자나 장면 조명과 같은 복잡한 디테일까지 처리해, 추가된 부분도 장면에 자연스럽게 반영되도록 합니다.원하지 않는 사물이나 인물 자연스럽게 제거하기: 조만간 이용자가 특정 장면에서 어떤 사물을 제거하면, 플로우가 배경과 주변 환경을 재구성해 마치 처음부터 없었던 것처럼 만들어 줄 것입니다. 혹시라도 놓치신 분들을 위해 알려드리자면, 최근 플로우에 ‘나노 바나나(Nano Banana)’기능이 적용되었습니다. 원본 프레임의 중요한 디테일은 유지하면서 소재를 편집할 수 있도록 도와줍니다. 지금 바로 플로우에서 창작을 시작해 보세요 구글은 더욱 정밀해진 편집 기능, 모든 기존 기능에 새롭게 추가된 오디오 기능, 그리고 비오 3.1 기반의 고품질 결과물을 통해 플로우 안에서 더 풍부하고 강력한 동영상 스토리텔링의 새로운 가능성을 열어가고 있습니다.비오 3.1 모델은 개발자를 위한 제미나이 API(Gemini API)와 기업 고객을 위한 버텍스 AI(Vertex AI), 제미나이 앱을 통해서도 이용할 수 있습니다. 신규 기능은 제미나이 API 2 와 버텍스 AI 3 에서 모두 이용할 수 있습니다. 출처 https://blog.google/intl/ko-kr/products/veo-updates-flow-kr 2025년 10월 28일
Gemini Enterprise 에이전트 생태계를 지원하는 파트너 구글 인사이트 by Miyeon. Jo 2025년 10월 17일 Google Cloud는 AI의 미래가 개방적이고 유연하며 상호 운용 가능해야 한다고 믿습니다.오늘, 모든 직원이 모든 워크플로우에서 Google AI의 장점을 활용할 수 있도록 하는 새로운 에이전트 플랫폼인 Gemini Enterprise 출시와 함께, 파트너가 솔루션을 통합하고 시장에 출시할 수 있는 강력한 새로운 기회를 소개합니다.저희 AI 생태계는 이미 번성하고 있으며, 오늘날 Google Cloud 고객에게 수천 개의 파트너 구축 에이전트가 제공됩니다. 더 중요한 것은, 이 엄선된 에이전트 세트는 Google Cloud에 의해 검증되어 고객이 에이전트를 사용하여 비즈니스를 혁신할 때 품질과 보안에 대한 확신을 가질 수 있도록 합니다. Gemini Enterprise에서 파트너 구축 에이전트 확장 저희의 목표는 Gemini Enterprise를 고객이 선도적인 기술 및 SaaS 제공업체의 에이전트를 포함하여 매일 사용하는 에이전트에 액세스할 수 있는 중앙 허브로 만드는 것입니다. Gemini Enterprise와 Agent2Agent (A2A) 프로토콜의 조합으로 에이전트는 서로 안전하게 통신하고 복잡한 작업을 조정할 수 있습니다. 오늘 Gemini Enterprise 호환 에이전트를 발표하는 일부 파트너는 다음과 같습니다. Box: Box AI 에이전트를 통해 사용자는 Box의 기존 권한을 존중하면서 질문하고, 복잡한 문서를 요약하고, 파일에서 데이터를 추출하고, 새로운 콘텐츠를 생성할 수 있습니다.Dun & Bradstreet: D&B의 Look Up 에이전트는 전 세계적으로 신뢰받는 식별자인 D-U-N-S 번호를 사용하여 내부 및 타사 소스의 비즈니스 데이터를 통합하여 엔터프라이즈 워크플로우 전반에 걸쳐 정확하고 효율적인 통합을 제공합니다.Manhattan Associates: Manhattan의 Solution Navigator 에이전트는 Manhattan Active 솔루션, 정책 및 운영에 대한 즉각적인 답변을 제공하여 응답 시간과 효율성을 가속화합니다.OpenText: Core Content Aviator는 AI 지원을 통해 정보를 검색하고 요약할 수 있도록 하여 문서 생성 및 다국어 번역을 포함한 콘텐츠 관리를 간소화합니다.Salesforce: Agentforce 및 Slack의 데이터를 기반으로 구축된 에이전트는 Gemini Enterprise 내에서 사용자에게 액세스할 수 있어 AI 기반 생산성 및 비즈니스 통찰력을 향상시킵니다.S&P Global: S&P의 Data Retrieval 에이전트는 사용자가 수익 보고서 분석, 시장 조사 수행 및 재무 지표 검색을 직접적인 출처 인용과 함께 수행할 수 있도록 돕습니다.ServiceNow: A2A 및 ServiceNow AI Agent Fabric을 통해 ServiceNow AI Agents for Service Observability는 Google Gemini 기반 에이전트와 연결하여 고객 클라우드 배포의 문제를 감지, 조사 및 수정 권장 사항을 제공하여 인시던트 관리를 간소화하고 조직의 민첩성을 향상시킵니다.Workday: Workday 에이전트(예: 셀프 서비스 에이전트)는 즉각적인 통찰력을 제공하고 잠재적인 예산 초과를 표시하고, 휴가 신청을 제출하고, HR 사례를 생성하고, 급여 정보를 관리하는 등 직원 워크플로우 내에서 직접 빠른 조치를 가능하게 합니다. Amplitude, Avalara, CARTO, Cotality, Dynatrace, Elastic, Fullstory, HubSpot, Invideo, Optimizely, Orion by Gravity, Pegasystems, Quantum Metric, Supermetrics, Trase Systems, UiPath, Vianai를 포함한 이들 및 기타 많은 파트너가 Gemini Enterprise와 에이전트를 통합하기 위해 노력하고 있습니다. 자연어 검색을 사용하여 검증된 에이전트 검색 Gemini Enterprise와 통합되는 파트너 에이전트를 배포하는 것 외에도 고객은 이제 새로운 Gemini 기반 AI 에이전트 찾기를 사용하여 자연어 검색을 통해 필요한 AI 에이전트를 찾을 수 있습니다. 고객은 신뢰할 수 있는 공급업체의 에이전트를 검색하고 산업, 사용 사례, A2A 및 Gemini Enterprise 배포를 위해 검증되었는지 여부로 필터링할 수 있습니다. 이러한 에이전트는 Google Cloud Marketplace 또는 파트너를 통해 직접 구매하여 환경에 배포할 수 있습니다.이 엄선된 검색 경험은 향상된 AI 에이전트 생태계 프로그램과 파트너가 에이전트를 검증하기 위한 엄격한 프레임워크를 통해 가능합니다. 또한 성능 및 품질에 대한 최고 표준을 충족하는 에이전트를 인식하기 위해 새로운 “Google Cloud Ready – Gemini Enterprise” 지정을 도입하여 신뢰할 수 있는 솔루션 채택을 가속화하고 파트너에게 에이전트를 수익화할 수 있는 새로운 경로를 제공합니다. 고객의 AI 성공을 돕기 위한 파트너 서비스 확장 Google Cloud는 전문 서비스 접근 방식에서 파트너 주도적입니다. 오늘 Gemini Enterprise 출시와 함께 컨설팅 파트너는 이미 고객이 AI 에이전트 채택을 가속화할 수 있도록 서비스 제공을 확장하고 있습니다. 실제로 이들 파트너 중 다수는 이미 Gemini Enterprise를 사용하여 자체 비즈니스를 운영하고 있습니다. 주요 확장은 다음과 같습니다. Accenture는 산업 전반의 고객에게 Google Cloud의 AI 기술을 성공적으로 채택하도록 유도하고 있습니다. Accenture와 Google Cloud 생성형 AI COE를 통해 에이전트 기능을 확장하고 Google Cloud Marketplace에 에이전트를 출시하고 있습니다.Deloitte는 라이브 에이전트의 “Agent Fleet”를 활용하여 고객이 Gemini Enterprise를 사용하여 산업 맞춤형 에이전트를 배포하고 대규모로 공동 혁신할 수 있도록 돕고 있습니다.Capgemini는 Google Cloud의 AI 기술을 사용하여 다양한 분야에서 다양한 에이전트를 개발했으며, 이를 Gemini Enterprise 및 Google Cloud Marketplace에 제공할 예정입니다.Cognizant는 Gemini Enterprise의 내부 사용 및 전 세계 Google Cloud COE에 대한 투자를 통해 고객의 에이전트 AI 채택을 가속화하고 있습니다.GlobalLogic, Hitachi Group Company는 Gemini Enterprise를 내부적으로 채택하고 AI 에이전트를 안전하게 대규모로 구축하는 것을 포함하여 고객 채택을 가속화하기 위한 디지털 엔지니어링 서비스를 제공할 것입니다.KPMG는 Gemini Enterprise를 사용하여 고객 제공의 속도, 정확성 및 품질을 향상시키고 AI 및 에이전트를 통해 KPMG의 직원 경험을 향상시켜 일상 업무를 더 쉽게 만들고 있습니다.PwC는 에이전트 OS 기술과 Gemini Enterprise를 결합하여 고객 AI 혁신을 발전시키고 있으며, 내부적으로 성공적으로 사용한 에이전트 배포를 포함합니다. Gemini Enterprise에 에이전트 가져오기 시작 Gemini Enterprise는 오늘부터 사용할 수 있으며, 저희 생태계의 수천 개의 에이전트에 대한 액세스를 포함합니다. 더 자세히 알고 싶은 파트너는 AI 에이전트 프로그램 페이지를 방문할 수 있습니다.저희는 파트너에게 Gemini Enterprise에서 AI 에이전트를 확장하는 데 필요한 플랫폼과 리소스를 제공하기 위해 최선을 다하고 있으며, 파트너가 고객에게 제공할 솔루션을 기대합니다. 출처 https://cloud.google.com/blog/topics/partners/partners-powering-the-gemini-enterprise-agent-ecosystem?hl=en 2025년 10월 17일
AI 이미지의 새로운 기준, Gemini 2.5 Flash(Nano-Banana) 구글 인사이트 by Miyeon. Jo 2025년 10월 01일 지금까지 AI 이미지는 놀라운 잠재력을 보여주면서도, 디자이너와 크리에이터에게는 여전히 아쉬움을 남기곤 했습니다. 예를 들어, 원하는 캐릭터의 일관성을 유지하기 위해 수없이 많은 수정을 거쳐야 했고, 간단한 편집조차 복잡한 프롬프트를 요구했습니다.Google Cloud는 이러한 한계를 뛰어넘는 완전히 새로운 AI 모델, Gemini 2.5 Flash Image(일명 nano-banana)를 공개했습니다. 이 모델은 이미지 생성은 물론, 전문가 수준의 편집 기능까지 갖춰 창의적인 아이디어를 더욱 풍부하고 생생한 비주얼로 구현해 줍니다. Gemini 2.5 Flash의 혁신적인 핵심 기능 Gemini 2.5 Flash Image는 단순히 이미지를 만드는 것을 넘어, 창의적인 작업 과정을 획기적으로 개선할 수 있습니다.하나의 그림에 여러 아이디어를 담는 ‘다중 이미지 퓨전’ 마케팅 광고를 위해 제품 사진과 특정 배경 이미지를 결합해야 한다고 상상해 보세요. Gemini 2.5 Flash는 여러 장의 이미지를 하나의 매끄러운 비주얼로 자연스럽게 결합해 줍니다. 이제 참고 이미지들을 활용해 마케팅, 교육, 광고 등 원하는 분야에서 완벽하게 통합된 이미지를 만들 수 있습니다.언제나 동일한 캐릭터를 만드는 ‘캐릭터 및 스타일 일관성’ 웹툰 작가가 여러 컷에 걸쳐 동일한 주인공의 다양한 표정과 포즈를 그려야 할 때, 혹은 게임 개발자가 캐릭터를 여러 장면에 배치해야 할 때를 생각해 보세요. Gemini 2.5 Flash는 여러 이미지를 생성해도 인물이나 제품의 아이덴티티와 시각적 스타일을 그대로 유지합니다. 이제 번거로운 미세 조정 작업 없이도 완벽한 일관성을 확보할 수 있습니다.말 한마디로 손쉽게 ‘대화형 편집’ 복잡한 편집 툴을 다루는 대신, 자연스러운 언어로 이미지를 편집해 보세요. “그룹 사진에서 뒤에 있는 사람을 지워줘”라고 말하거나, “셔츠의 얼룩을 없애줘”라고 지시하기만 하면 Gemini 2.5 Flash가 즉시 변경 사항을 적용합니다. 이 직관적인 기능은 창작 과정의 효율을 극대화합니다. 책임감 있는 AI 기술 Gemini 2.5 Flash Image는 현재 Vertex AI에서 미리보기 버전으로 제공됩니다. 이는 개발자와 기업이 강력하고 안전한 플랫폼 위에서 모델을 활용할 수 있다는 의미입니다. 또한, 책임감 있는 AI 사용을 위해 생성된 모든 이미지에는 육안으로 식별하기 어려운 SynthID 워터마크가 기본으로 내장되어 투명성을 높입니다. 고객이 직접 경험한 Gemini 2.5 Flash 다양한 분야의 리더들이 이미 Gemini 2.5 Flash Image를 활용해 다음 세대 비주얼을 구축하고 있습니다.Adobe: Adobe는 Gemini 2.5 Flash Image를 Firefly 및 Express에 통합하여, 사용자들이 업계 최고의 모델로 아이디어를 유연하게 탐색하고 멋진 콘텐츠를 쉽게 만들 수 있게 했습니다. Creative Cloud 앱 전반에 걸쳐 아이디어 구상부터 최종 결과물까지 이어지는 완벽한 창의적 워크플로를 제공합니다.Poe(by Quora): “Gemini 2.5 Flash Image는 여러 번의 수정에도 세부적인 디테일과 장면의 의미를 보존하는 뛰어난 능력을 보였습니다. 낮은 응답 시간 덕분에 더욱 자연스러운 대화형 편집 루프가 가능해졌습니다.”WPP: 이 모델의 성능을 테스트한 결과, 여러 제품을 하나의 프레임으로 결합하는 능력과 높은 수준의 객체 일관성을 유지하는 능력에 깊은 인상을 받았습니다. 특히 소매 및 소비재 부문에서 강력한 활용 사례를 기대하고 있습니다.Freepik: “시각 콘텐츠를 다루는 모든 사람에게 중대한 업그레이드입니다. 복잡한 편집을 손쉽게 처리하여 세련되고 전문적인 결과를 즉시 만들어냅니다.”Leonardo.ai: “정확하고 반복적인 변경을 제공하며, 캐릭터와 객체 일관성을 유지하면서도 큰 변화를 줄 수 있는 극도의 유연성을 보여줍니다. 이 모델은 완전히 새로운 워크플로와 창의적 가능성을 열어줄 것입니다.”Figma: 이제 AI 이미지 도구에 Gemini 2.5 모델이 포함되어, 디자이너들이 텍스트 프롬프트만으로 디자인 비전을 전달하는 데 도움이 되는 사실적인 콘텐츠를 만들 수 있게 되었습니다.Gemini 2.5 Flash는 단순히 새로운 도구가 아닌, 창의 산업의 작업 방식을 변화시킬 게임 체인저입니다. 여러분도 이 혁신의 시작에 함께하시길 바랍니다.Gemini 2.5 Flash Image는 현재 Vertex AI에서 확인 가능합니다. Documentation을 확인하고, 새로운 창작의 세계를 경험해보세요. Gemini Enterprise에 에이전트 가져오기 시작 Gemini Enterprise는 오늘부터 사용할 수 있으며, 저희 생태계의 수천 개의 에이전트에 대한 액세스를 포함합니다. 더 자세히 알고 싶은 파트너는 AI 에이전트 프로그램 페이지를 방문할 수 있습니다.저희는 파트너에게 Gemini Enterprise에서 AI 에이전트를 확장하는 데 필요한 플랫폼과 리소스를 제공하기 위해 최선을 다하고 있으며, 파트너가 고객에게 제공할 솔루션을 기대합니다. 출처 https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-flash-image-on-vertex-ai?hl=en 2025년 10월 01일
Google Workspace 사용자가 필요한 솔루션을 빌드할 수 있도록 지원하는 AppSheet와 Apps Script 구글 인사이트 by Miyeon. Jo 2025년 09월 18일 2020년 Google은 새로운 Google Workspace를 발표하였고, 여기에는 Google Cloud의 노코드 개발 플랫폼인 AppSheet와 Google Workspace의 통합 로우 코드 개발 플랫폼인 Apps Script를 통해 기존 Google Workspace보다 훨씬 효과적으로 생산성을 확장 및 맞춤설정할 수 있는 기능을 포함했습니다.이 플랫폼들의 강점은 코딩 지식이 없는 사용자도 작업을 맞춤설정할 수 있다는 데 있습니다. 현장팀이 고객 방문을 추적하는 데 사용할 수 있는 앱, 특정 계산을 수행하는 Sheets의 커스텀 함수, 반복적인 태스크를 자동화하는 매크로 등 무엇을 빌드하든 AppSheet 및 Apps Script를 사용하면 이러한 유형의 커스텀 솔루션을 어느 때보다도 손쉽게 만들 수 있습니다.AppSheet와 Apps Script는 비즈니스 앱, 워크플로, 자동화 빌드를 통해 Google Workspace의 기능을 확장하도록 사용자를 지원합니다. AppSheet를 사용하면 코드를 작성하지 않고도 Google Workspace 애플리케이션은 물론 현재 환경의 다른 모든 서비스 및 애플리케이션을 기반으로 한 커스텀 애플리케이션을 빌드할 수 있습니다. 한편 Apps Script에서는 코드 몇 줄만 작성하면 Sheets 함수, 메뉴 항목, 트리거, 데이터 검증 등의 맞춤설정으로 Google Workspace 애플리케이션의 동작을 확장하고 수정할 수 있습니다. 노코드 플랫폼을 사용한 Google Workspace 확장 진정한 노코드 플랫폼인 AppSheet에서는 즐겨 사용하는 Google Workspace 애플리케이션을 활용하는 앱 또는 워크플로 등을 만들고 배포할 때 코딩 환경이 필요하지 않습니다. AppSheet의 UI를 사용하면 머신 러닝 기반의 자연어 기능은 물론 복잡한 코드를 Sheets 수식과 유사한 사용자 친화적 형태로 변환해 주는 표현식을 포함한 모든 작업이 가능합니다. 일반적인 사용 사례로는 현장 서비스 및 데이터 캡처, 운송 물류, 규정 준수 보고, 배송 추적, 간이 재물조사 등이 있습니다.AppSheet 애플리케이션을 사용하면 광범위한 데이터 소스와 함수를 활용할 수 있습니다. 커스텀 애플리케이션 및 SQL 데이터베이스에서 캡처한 데이터부터 Google 지도 및 Google Workspace 애플리케이션(Sheets, Drive, Docs, Calendar, Meet 등)을 포함한 기타 소스에 이르기까지 다양한 활용이 가능한 AppSheet는 비즈니스 솔루션을 만들고 워크플로를 개선할 무한한 가능성을 제공합니다. AppSheet 애플리케이션은 모바일 및 웹 앱으로 배포되기 때문에 데스크톱, iOS 또는 Android 플랫폼에 상관없이 즐겨 사용하는 브라우저에서 지원되어 팀에서 일상 업무용 기기를 사용하는 데 유연성을 제공합니다. 코드 몇 줄로 Google Workspace 맞춤설정 Apps Script는 Google Workspace에 포함된 로우 코드 개발 플랫폼으로서 Google Workspace에 통합되는 커스텀 비즈니스 솔루션을 쉽고 빠르게 빌드하고 내부 프로세스를 자동화하며 Gmail, Docs, Sheets, Drive와 같이 즐겨 사용하는 앱을 확장해 줍니다. Apps Script에서는 스크립트 언어인 자바스크립트를 사용하고 기본적으로 Google Workspace API 및 이벤트와 통합하여 메뉴부터 매크로, 자동화까지 커스텀 비즈니스 솔루션의 빌드를 전체적으로 지원하므로 일상적인 업무를 간소화할 수 있습니다.Apps Script는 복잡한 과정 없이 작업을 처음부터 순조롭게 진행할 수 있도록 이미 작업 중인 환경에서 이용할 수 있도록 설계되었습니다. 완전히 클라우드 방식으로, Google Drive에서 작업이 가능합니다. 아무 것도 다운로드하거나 구성할 필요가 없으며 서버나 인프라를 유지보수할 필요도 없습니다. 코딩 경험이 별로 없다면 망설여지겠지만 Apps Script는 비즈니스 사용자를 염두에 두고 설계되었으며 수많은 복잡한 과정을 삭제했기 때문에 쉽게 시작할 수 있습니다. 포럼에서 사용자들이 공유한 솔루션 및 스크립트 예시, 온라인 가이드 등 다양한 지원 리소스 덕분에 개발자는 물론 기술 지식이 없는 사용자도 Apps Script를 사용해 Google Workspace를 맞춤설정하고 자동화하는 솔루션을 쉽고 빠르게 빌드할 수 있습니다.솔루션 자동화가 코드 몇 줄을 복사해 붙여넣으면 될 정도로 간단한 경우도 있습니다. 자바스크립트를 경험해 본 적이 있다면 Apps Script로 쉽게 더욱 많은 작업을 처리하며 기술 역량을 높일 수 있습니다. AppSheet, Apps Script 또는 둘 다 사용해 Google Workspace를 다양하게 활용 Apps Script를 사용하면 커스텀 로직으로 Google Workspace 애플리케이션을 확장하고 수정할 수 있습니다. 또한 AppSheet에서는 Google Workspace와 다른 서비스 및 애플리케이션을 기반으로 한 커스텀 애플리케이션 및 비즈니스 자동화를 빌드할 수 있습니다. 작은 프로세스의 속도를 높여주는 간단한 스크립트부터 전체 비즈니스 계열 워크플로를 재정의하는 정교한 앱 또는 자동화에 이르기까지 시급한 비즈니스 니즈에 맞는 새로운 솔루션을 그 어느 때보다도 손쉽게 만들 수 있습니다. Apps Script와 AppSheet는 단독으로 사용해도 강력하지만 상호 보완적인 특징 때문에 함께 사용하면 훨씬 더 효과적입니다.실제로 IT팀에서 처리하지 못하는 많은 앱을 일반인 개발자가 만들어 지원한 덕분에 제품 백로그가 현저히 줄어든 기업이 많습니다. 솔루션을 빌드하고자 하는 일반인 개발자는 솔루션을 빌드할 수 있는 노코드 및 로우 코드 도구를 원합니다. 더구나 AppSheet와 Apps Script는 일반인 개발자뿐만 아니라 기존 IT 개발자도 워크플로 속도를 높이거나 작업을 보다 쉽게 처리하는 데 사용할 수 있습니다. 또한 두 솔루션 모두 앱 생성 프로세스의 적절한 가시성과 거버넌스를 유지하는 데 필요한 도구를 IT팀에 제공합니다. 출처 https://cloud.google.com/blog/ko/topics/workspace-developer/when-to-use-appsheet-or-apps-script-in-google-workspace?hl=ko 2025년 09월 18일
기업 시각에서 바라본 AI 에이전트의 핵심 키워드 3가지 구글 인사이트 by Miyeon. Jo 2025년 09월 01일 기업이 AI를 비즈니스에 적용할 때 AI 에이전트 애플리케이션은 일반적으로 임베디드, 워크플로우, 리액티브 3가지 유형으로 분류된다.가트너는 최근 공개한 하이프 사이클(Hype Cycle) 보고서에서 생성형 AI가 곧 ‘환멸의 골짜기(trough of disillusionment)’에 들어설 것이며, AI 에이전트는 ‘기대의 정점(peak of inflated expectations)’에 있다고 분석했다. 그러나 기업 현장의 시각은 다소 다르다. 기업 IT 담당자는 애초부터 생성형 AI에 큰 기대를 걸지 않았으며, AI 에이전트가 주목받고 있다는 점에는 동의하지만 처음부터 그렇게 인식했기 때문에 ‘에이전트 환멸의 골짜기’에 빠질 것이라고 보지 않는다.시각 차이가 존재한다는 사실만으로도 의미가 크다. 그러나 더 중요한 것은, 이런 차이가 생긴 이유다.기업은 줄곧 AI를 ‘에이전트’ 관점에서 바라봤다. 기업의 IT 전문가는 가치 있는 AI 애플리케이션 대부분이 인터넷 전반을 학습한 거대한 범용 툴이 아니라, 특정 비즈니스 운영 영역에 집중하는 전문가형 AI여야 한다고 본다. 이런 방식은 상대적으로 적은 호스팅 자원만 필요로 하며, 실제 비즈니스 프로세스에 맞춰 적용할 수 있다. 바로 이 ‘분리된 에이전트 개념(compartmentalized agent concept)’은 기업이 AI가 강력한 비즈니스 매출을 낼 수 있다고 판단하는 유일한 길이다. 목적지보다 중요한 것은 여정이라는 말이 있다. 이번 경우도 마찬가지로, 세간에서 떠드는 화려한 AI나 에이전트가 아니라 현실적이고 타당한 비즈니스 활용을 통해 의미 있는 여정을 밟는 것이 핵심이다. 그리고 그 여정은 3가지 키워드로 설명할 수 있다. 임베디드(Embedded), 리액티브(Reactive), 워크플로우(Workflow). AI 에이전트와 관련해 들어본 적 있을 것이다. 이 3가지는 기업이 AI 에이전트 애플리케이션을 분류할 때 사용하는 범주다. 에이전트는 AI의 진정한 미래로 평가되는 기술이며, 따라서 이 3단어는 이 분야 전체에서 가장 중요한 키워드일 수 있다. 동시에 이는 클라우드에 호스팅된 거대한 범용 챗봇에 쏠린 대중적 관심과, 이를 실제로 활용하는 기업 IT의 접근 방식 사이에서 벌어지는 간극을 보여주는 신호일 수도 있다.기업이 AI 에이전트를 도입하며 쌓아온 여정은 결국 3가지 뚜렷한 범주를 인식하게 만들었고, 바로 이것이 여기서 다룰 ‘3가지 작은 단어’로 요약된다. 1) 리액티브 AI 에이전트 리액티브 범주부터 살펴보는 것이 적절하다. 이 범주는 기업이 사용한다고 알려진 전체 AI 에이전트 애플리케이션 중 거의 절반을 차지하기 때문이다. 초기의 기업용 AI 애플리케이션 대부분은 판매 전후 고객 지원을 목적으로 한 챗봇이었다. 그런데 일부는 데이터 보안과 데이터 주권 문제로 인해 점차 온라인 AI 챗봇에서 에이전트 애플리케이션으로 전환되고 있다. 이 흐름 때문에 리액티브형은 대부분 기업이 처음으로 도입한 에이전트 유형이 되었다. 겉보기에는 흔히 접하는 온라인 챗봇 앱과 비슷하지만, 작동 방식은 다르다. 이 애플리케이션은 인터넷 전체 데이터가 아니라 특화된 데이터를 학습시켜 만든 ‘파운데이션 모델’을 기반으로 하고, 이후 RAG(Retrieval-Augmented Generation) 방식을 통해 기업 고유의 데이터를 연결한다. 따라서 이 유형은 하이브리드 모델의 초기 활용을 가장 많이 이끌 것으로 예상된다. 주요 대상 사용자는 전문직 종사자다. 의료, 법률, 여러 엔지니어링 분야, 일부 비즈니스 기획자 등이 리액티브 에이전트를 활용하는 대표적인 그룹이다. 2) 임베디드 AI 에이전트 현재 기업이 사용하는 에이전트 애플리케이션 가운데 약 1/3은 임베디드 범주에 속한다. 대부분은 직접 개발한 것이 아니라 서드파티 소프트웨어 형태로 도입되고 있다. 임베디드 에이전트는 생성형 AI와 관련이 없고, 오히려 ML(machine learning) 범주에 더 가깝다. 하지만 최근 기업은 SLM(small language model)이 전통적인 ML을 대체하고 있다고 말한다. 결과가 더 뛰어나기 때문이다. 이런 애플리케이션은 효용성 중심으로 평가된다. 즉, 사용자는 최신 AI 여부보다는 구체적인 효익을 제공하는지에 더 큰 비중을 둔다. 또한 임베디드형 에이전트는 호스팅 요구사항이 매우 적어 서로 통합하거나 리소스를 공유하려는 움직임도 거의 없다. 3) 워크플로우 에이전트 워크플로우 에이전트는 기업이 직접 개발하는 경우가 가장 많으며, 2025년 현재 가장 빠르게 성장하는 유형으로 꼽힌다. 임베디드 에이전트가 애플리케이션 기능을 중심으로 AI가 보조적 역할을 하는 것과 달리, 워크플로우 에이전트는 기업이 AI 접근 방식 자체를 선택해야 하고, 동시에 호스팅 환경에 대해서도 고려해야 한다. 이들 가운데 약 2/3는 오픈소스 모델을 기반으로 하며, 보통 단일 랙을 넘지 않는 소규모 GPU 서버 클러스터에서 운영된다. 기업이 직접 모델을 선택하고 클러스터를 구축하는 셀프 호스팅 AI도 주로 이 영역에 집중되어 있다. 에이전트 간 워크플로우(agent-to-agent workflow)가 가장 활발히 구현되는 것도 이 유형이다. MCP(Model Context Protocol)와 A2A(Agent2Agent) 활용이 이 유형에서 가장 활발하다. 워크플로우 영역에서의 MCP 도입 경험은 리액티브 에이전트 애플리케이션에서도 MCP가 입지를 넓히는 데 도움을 주는 것으로 보인다.기업이 마주한 새로운 질문에이전트 기술이 3가지 범주로 구분된다는 사실은 기업이 계속에서 AI 에이전트를 자사 비즈니스 모델에 맞게 적용하고 있음을 보여준다. 이쯤에서 자연스럽게 이런 질문이 따른다. 앞으로 더 세밀한 조정이 이뤄질 것인가? AI 활용 방식에 영향을 줄 변화와 개선이 계속 이어질 것인가? 그리고 최종적으로는 어떤 기술과 업체가 AI 경쟁에서 주도권을 차지하게 될까?이런 질문에 답하기 위해 점점 커지는 API의 중요성을 살펴볼 필요가 있다. 기업은 자체적으로 AI를 호스팅할 때 주로 워크플로우 모델을 중심으로 활용해왔기 때문에 자연스럽게 에이전트 간 연계와 API에 관심을 두고 있다. 그 결과 A2A API의 중요성이 높아졌으며, 앞으로는 이와 같은 모델이 워크플로우 통합에서 API와 애플리케이션을 연결하는 방식으로 자리 잡을 가능성이 크다.예상되는 또 다른 변화는 프론트엔드 기술을 활용해 리액티브 에이전트 모델을 보강하는 것이다. 초기의 기업 리액티브 에이전트 개발 사례를 보면 대부분 경우 에이전트가 자유로운 형태의 사용자 질문을 이해할 필요는 없으며, 이를 필수 조건으로 만들면 오히려 운영에 필요한 자원이 2배로 늘어난다는 점이 드러났다. 에이전트가 특정 영역에 특화되어 있다면, 간단한 어휘 체계만으로도 충분할 뿐 아니라 프로젝트 ROI도 높일 수 있다는 의미다. 일부 기업은 프론트엔드 애플리케이션을 활용해 프롬프트를 생성하면 동일한 에이전트로 3가지 범주의 에이전트 모델을 모두 지원할 수 있다고 설명한다. 하나의 프론트엔드에서는 워크플로우나 실시간 이벤트를 처리하고, 다른 프론트엔드를 통해서는 인간과의 상호작용을 처리할 수 있다는 것이다.대중적으로 사용되는 서비스형 AI(AI-as-a-service)와 달리, 기업이 활용하는 AI 에이전트는 셀프 호스팅되는 경우가 많고 훈련 시점의 데이터뿐 아니라 기업 데이터에 지속적으로 접근해야 한다. 이 같은 데이터 통합 방식의 변화는 데이터 주권, 비용, 성능에 대한 우려를 불러일으키고 있다. 특히 클라우드 컴퓨팅, AI, 기업 인프라 간의 상호작용은 AI 관련 문제로 가장 많이 언급되며, 앞으로 반드시 짚고 넘어가야 할 핵심 과제다. 출처 ITWorld 오피니언 2025년 09월 01일
AI에이전트 시대 성큼, ‘산업특화’가 성공 열쇠_버티컬(산업특화) AI 에이전트 구글 인사이트 by Miyeon. Jo 2025년 08월 20일 범용 인공지능(AI)이 대중의 시선을 사로잡은 지 불과 2년여 만에, 기업 현장의 관심은 한층 구체적인 목표를 향하고 있다. ‘무엇이든 할 수 있는 AI’보다 ‘한 분야를 완벽하게 해내는 AI’, 이른바 ‘버티컬(산업특화) AI 에이전트’가 새로운 경쟁력으로 부상한 것이다.17일 삼성SDS ‘버티컬 AI 에이전트, 산업을 혁신하는 특화 AI 시대’ 리포트에 따르면, 산업 특화 AI 에이전트는 단순 자동화를 넘어 복잡한 의사결정과 운영까지 자율적으로 수행하며 각 산업의 핵심 과제를 정조준하고 있다.최근 AI 활용의 무게중심이 ‘코파일럿’에서 ‘오토파일럿’으로 옮겨가는 가운데, 반복 업무뿐 아니라 상황별 판단과 대응이 요구되는 미션크리티컬(Mission-Critical) 영역에서 사람의 개입 없이도 안정적으로 실행할 수 있는 AI가 필요해진 까닭이다.버티컬 AI 에이전트의 정의는 특정 도메인의 데이터·규제·업무 프로세스를 깊이 이해하고 이를 기반으로 설계된 지능형 소프트웨어로 소개된다. 각 산업에 최적화된 방식으로 미세 조정된 대규모언어모델(LLM)에 멀티모달과 외부 시스템 연동 등 필요한 능력을 결합해 실질적인 팀원처럼 행동하는 것이 핵심이다.버티컬 AI 에이전트는 이미 구체적인 사례와 성과를 만들어내고 있다. 대표적으로 군사 분야 버티컬 AI 기업이라고 할 수 있는 미국의 팔란티어는 방산·국방 분야에 특화 데이터 분석 AI를 제공하며 최근 1년 사이에 주가가 300% 넘게 상승, 미국 최대 방산 기업인 록히트마틴의 시가총액을 넘어서기도 했다.영역별로 살펴보면 제조업도 버티컬 AI 에이전트의 대표적인 수혜 분야다. 생산 라인 최적화, 고장 예측, 품질 검사 등에서 AI 에이전트가 스마트팩토리의 핵심축으로 작동할 수 있다. 미국 전사적자원관리(ERP) 기업 에피코는 제조업 공급망을 위한 버티컬 AI 에이전트 네트워크 ‘에피코 프리즘’을 코드 어시스턴트로 활용하는 방법을 제안한다. 챗봇이 적용된 ERP를 통해 생산·구매·물류 인사이트에 접근하고, 공급업체와의 커뮤니케이션으로부터 견적 요청서를 자동 발행하는 식이다.자동차 산업에서는 구글 클라우드가 최근 ‘차량 내 비서’ 개발을 위한 전용 AI 에이전트를 선보이며 주목받고 있다. 자사 제미나이 모델과 버텍스 AI 기반으로, 내비게이션 음성 제어, 개인화 추천, 차량 정비 알림, 스마트홈 연동 등 운전 경험 전반을 재정의한다. 메르세데스-벤츠는 이를 전기차 신모델에 적용한 상태다.금융권 역시 AI 에이전트를 리스크 관리의 전면에 배치하고 있다. 머신러닝 기반 신용평가 솔루션은 방대한 금융 데이터를 분석해 부실 위험을 조기에 감지하고, 대출 조건을 정밀 조율한다. 에이전트 기반 사기 탐지 솔루션도 나와 있다. 신원 및 사기방지 플랫폼 기업 앨로이가 금융사 및 핀테크 기업을 위해 출시한 ‘프러드 어택 레이더(Fraud Attack Radar)’가 대표적이다. 세일즈포스의 글로벌 설문조사에 따르면 금융 서비스 분야 고객의 54%가 AI 에이전트 활용을 신뢰하며, 77%는 사기 예방·탐지에 AI가 도움이 된다고 평가했다.유통·커머스 분야에서는 고객 경험 혁신을 목표로 한 AI 에이전트가 빠르게 확산되고 있다. 온라인몰과 오프라인 매장을 아우르며 개인화 추천을 제공하고, 수요 예측·재고 관리·동적 가격 책정까지 자동화하는 것이 특징이다. 카카오벤처스가 투자한 스타트업 ‘젠투(Gentoo)’는 온라인 상품 정보와 리뷰를 학습해 오프라인 매장의 베테랑 점원처럼 고객 맞춤형 상담을 제공하며, 실제 이러한 혁신성을 바탕으로 ‘포브스 아시아 100대 유망기업’에 선정됐다.산업 특화 AI 에이전트의 성공은 기술 그 자체보다 산업별 요구와 데이터 환경을 반영한 설계와 운영이 필수적으로, 결국 ‘문제를 얼마나 깊이 이해하고 해결하느냐’에 달려 있다는 분석이 지배적이다. 범용 AI가 개척한 시장 위에서 이제 특화 AI 에이전트가 각 산업의 경쟁 구도를 재편할 다음 주자로 자리 잡고 있다. 출처 디지털데일리 : https://www.ddaily.co.kr/page/view/2025081710195179441 2025년 08월 20일
기업을 위한 Gen AI 구현 가이드 Top 25+ 구글 인사이트 by Miyeon. Jo 2025년 08월 06일 AI를 배우는 가장 좋은 방법은 직접 만들어 보는 것입니다. 개방형 모델을 빠르게 배포하는 방법을 찾는 것부터 복잡하고 다중 에이전트 시스템을 구축하는 것까지, 시중에는 엄청난 양의 리소스가 넘쳐나기 때문에 어려움을 느끼기 쉽습니다.이러한 목적을 위해 저희는 Google Cloud에 대한 25개 이상의 유용한 사용 가이드를 엄선하여 생생한 컬렉션(정보 링크)으로 구성했습니다. 이 컬렉션은 네 가지 영역으로 나뉩니다.빠른 모델 배포: 효율적인 CI/CD 파이프라인을 구축하고, Llama 3와 같은 대규모 모델을 고성능 인프라에 배포하고, Vertex AI Studio에서 개방형 모델을 활용하세요.Gen AI 앱 및 다중 에이전트 시스템 구축: LangGraph를 사용하여 문서 요약기, 다중 턴 채팅 앱, 고급 연구 에이전트를 구축하세요.Fine tuning(미세 조정), 평가 및 RAG(검색 증강 생성): 지도 미세 조정, RAG, 인간 피드백 기반 강화 학습(RLHF)을 통해 모델을 개선하세요.통합(Integrations): 다국어 모바일 챗봇을 구축하거나 Google Cloud 데이터베이스와 통합하여 AI를 세상과 연결하세요.이 페이지를 북마크하고 링크 된 가이드의 최신 내용을을 자주 확인해 보세요. 1. 빠른 모델 배포 원하는 방식으로 배포: Gemma 3는 Google GenAI API, Vertex AI, Cloud Run, Cloud TPU, Cloud GPU 등 다양한 배포 옵션과 플랫폼 간 통합을 제공하여 사용 사례에 가장 적합한 옵션을 유연하게 선택할 수 있도록 지원합니다. 고성능 A3 VM에 Llama 3와 같은 대규모 모델을 배포합니다. 이 가이드는 AI 하이퍼컴퓨터 클러스터(GPU가 있는 A3 VM)를 프로비저닝하고 JAX를 사용하여 대규모 오픈 모델을 배포하여 최대 성능을 달성하는 Terraform 스크립트를 제공합니다. GitHub 프로비저닝 문서. AI 하이퍼컴퓨터에서 DeepSeek 모델과 Llama 4 모델에 액세스합니다. 이 TPU 레시피는 Trillium TPU와 JetStream MaxText Engine을 사용하여 Llama-4-Scout-17B-16E 모델을 배포하는 단계를 설명합니다. AI 하이퍼컴퓨터 Github 저장소의 추론 레시피를 사용하여 Llama4 Scout 및 Maverick 모델 또는 DeepSeekV3/R1 모델을 지금 바로 배포할 수 있습니다. Vertex AI Studio에서 오픈 모델을 사용합니다. 모델 선택은 더 이상 Gemini에만 국한되지 않습니다. Claude 모델도 선택할 수 있습니다. Vertex AI Studio에서 오픈 모델을 사용하는 방법의 문서가 링크되어 있습니다. 10분 이내에 Google Cloud Run에 원격 MCP 서버를 빌드하고 배포합니다. MCP 서버 호스팅을 위한 공식 Cloud Run 문서를 직접 참고하여 이 링크의 블로그에서는 원격 MCP 서버를 직접 설정하는 간단한 과정을 보여줍니다. 블로그. 2. Gen AI 앱 및 다중 에이전트 시스템 구축 Gemini Pro를 사용하여 문서(텍스트) 요약기를 만듭니다. 이 Python 노트북은 Vertex AI SDK를 사용하여 Gemini Pro 모델과 상호 작용하는 방법을 보여줍니다. 이 실습 과제는 긴 문서의 간결한 요약을 생성하는 것입니다. Github 레시피. Gemini를 사용하여 멀티턴 채팅 애플리케이션을 구축합니다. 이 노트북은 Gemini API를 사용하여 대화 내역을 기억할 수 있는 상태 저장 멀티턴 채팅 서비스를 구축하는 방법을 보여줍니다. 공식 문서. LangGraph를 사용하여 멀티모달 리서치 에이전트를 구축합니다. 루프 방식으로 작동하는 진정한 AI 에이전트를 구축하기 위한 고급 레시피입니다. LangGraph를 사용하여 에이전트가 웹을 검색하고, Gemini를 사용하여 결과에서 이미지를 분석하고, 최종 답변을 합성할 수 있는 워크플로를 생성합니다. 샘플 코드. 블로그. AI가 좋은 SQL 쿼리(텍스트-SQL)를 작성하도록 합니다. 최첨단 컨텍스트 구축 및 테이블 검색 방식, LLM-as-a-Judge 기법을 활용한 텍스트-SQL 품질 평가 방법, LLM 프롬프트 및 후처리에 대한 최적의 접근법, 그리고 시스템이 사실상 인증된 정답을 제공할 수 있도록 하는 기법에 대해 알아보세요. 가이드. 독립형 ADK/MCP 에이전트를 A2A 호환 컴포넌트로 변환하고 이러한 에이전트를 관리하는 오케스트레이터를 구축합니다. 프로젝트 소스 코드. 공식 A2A Python SDK. 공식 A2A 샘플 프로젝트 ADK를 사용하여 간단한 다중 에이전트 시스템(이 경우 여행 계획 시스템)을 구축합니다. 프로젝트 소스 코드를 살펴보세요. Google ADK를 사용하여 대화형 데이터 익명화 에이전트를 구축합니다. 에이전트는 테이블의 스키마와 데이터를 대화형으로 분석하여 민감한 열을 식별한 다음, 즉시 실행 가능한 SQL 스크립트를 제안 및 생성하여 익명화 및 샘플링된 복사본을 생성합니다. 프로젝트 샘플 코드를 살펴보세요. Imagen 3와 Gemini를 사용하여 강력한 브랜드 로고를 제작해 보세요. Imagen 3, Gemini, 그리고 Python 라이브러리 Pillow를 사용하여 로고로 브랜드 스타일을 구축하는 방법을 알아보세요. 샘플 코드도 제공됩니다. 3. Fine tuning(미세 조정), 평가 및 검색 RAG(증강 생성) Gemini를 활용한 Supervised Fine Tuning(지도 미세 조정)을 위한 최고의 모범 사례 가이드. 이 가이드는 개발자가 Supervised Fine Tuning 프로세스를 간소화하는 방법을 심층적으로 설명합니다. 여기에는 최적의 모델 버전 선택, 고품질 데이터세트 제작, 문제 진단 및 해결 도구를 포함한 모델 평가 모범 사례가 포함됩니다. 전체 가이드. Gen AI Github 저장소. Vertex AI RAG를 시작하기 위한 최고의 가이드. Vertex AI RAG Engine을 이해하는 데 필요한 주요 개념을 북마크하세요. 이러한 개념은 RAG(검색 증강 생성) 프로세스 순서대로 나열되어 있습니다. 시작하기 노트북. 프로덕션에 바로 적용 가능한 RAG 시스템 설계. 생성 AI 앱에서 Vertex AI와 벡터 검색의 엔드 투 엔드 역할을 이해하기 위한 포괄적인 아키텍처 가이드. 시스템 다이어그램, 설계 고려 사항 및 모범 사례가 포함되어 있습니다. 공식 아키텍처 가이드. 고급 RAG 기술: Vertex RAG Engine 검색 품질 평가 및 하이퍼파라미터 튜닝. RAG Engine을 사용하여 검색을 위한 하이퍼파라미터 튜닝을 평가하고 수행하는 방법을 알아보세요. Github 저장소. 강화 학습(RLHF)을 사용하여 모델 미세 조정. 이 튜토리얼은 Vertex AI에서 사람 피드백을 기반으로 한 강화 학습(RLHF)을 사용하여 대용량 언어 모델(LLM)을 튜닝하는 방법을 보여줍니다. 이 워크플로는 사람으로부터 수집된 피드백을 사용하여 모델의 정확도를 향상시킵니다. Colab. Vertex AI에서 비디오 입력을 미세 조정합니다. 콘텐츠 관리, 비디오 자막, 상세 이벤트 현지화 작업이 포함된 경우 이 가이드가 도움이 될 것입니다. 샘플 노트북. 개발 중에 텍스트 프롬프트와 모델을 빠르게 비교합니다. 이 “Rapid Evaluation” SDK를 사용하여 다양한 텍스트 기반 프롬프트 또는 모델의 출력을 나란히 빠르게 비교할 수 있습니다. Colab. Explainable AI를 사용하여 특성 기여도(Feature attribution)을 가져옵니다. 분류 및 회귀 모델의 경우, Vertex Explainable AI를 사용하여 모델이 특정 예측을 내린 이유를 파악합니다. 관련 문서. RAG 검색을 최적화하세요. 근본 원인 분석부터 테스트 프레임워크 구축까지, 환각을 최소화하고 AI 애플리케이션에 대한 신뢰를 구축하는 단계별 방법을 소개합니다. 블로그. 4. 통합(Integrations) 모바일용 다국어 챗봇 구축. Android에서 다국어 챗봇을 구축하기 위한 완벽한 엔드 투 엔드 가이드입니다. Gemma, Gemini API, MCP를 결합하여 강력하고 글로벌하게 사용 가능한 애플리케이션을 구축합니다. Github 저장소. 블로그. 외부 MCP 서버에 연결하는 ADK 에이전트를 개발합니다. MCP를 활용하여 위키백과 문서에 액세스하는 ADK 에이전트의 예시를 살펴보세요. 이는 외부 특수 데이터를 검색하는 일반적인 사용 사례입니다. 또한 MCP 통신을 위한 SSE(Server-Sent Events)를 대체하도록 설계된 차세대 전송 프로토콜인 Streamable HTTP도 소개합니다. 가이드. 텍스트 서비스용 Vertex AI 임베딩과 StackOverflow 데이터세트를 사용하여 텍스트 임베딩을 인코딩합니다. 벡터 검색은 완전 관리형 서비스로 운영 오버헤드를 더욱 줄여줍니다. Google Research에서 개발한 근사 최근접 이웃(ANN) 기술을 기반으로 합니다. 노트북. MCP를 Google Cloud 데이터베이스와 통합합니다. MCP 호환 AI 어시스턴트(Claude Code, Cursor, Windsurf, Cline 등)를 Google Cloud Databases와 통합하는 방법을 알아보세요. 이 블로그에서는 데이터베이스 쿼리를 처리하는 애플리케이션 코드 작성, 새 애플리케이션의 스키마 설계, 데이터 모델 변경 시 코드 리팩토링, 통합 테스트용 데이터 생성 방법 등을 안내합니다. 블로그 출처https://cloud.google.com/blog/products/ai-machine-learning/top-gen-ai-how-to-guides-for-enterprise?hl=en 2025년 08월 06일
Looker 개발자, 지속적 통합(Continuous Integration) 도입으로 속도와 정확성 확보 구글 인사이트 by Miyeon. Jo 2025년 07월 24일 수천 개의 연결 가능한 데이터 소스와 무수히 많은 맞춤형 도구를 기본으로 제공하는 Looker는 개발자들이 클라우드 우선의 오픈소스 친화적인 모델을 활용하여 새로운 데이터 해석 및 경험을 창출할 수 있도록 돕습니다. 오늘, 저희는 Looker를 위한 지속적 통합(Continuous Integration for Looker) 출시를 통해 현대 소프트웨어 엔지니어링 원칙을 적용하여 개발 속도를 높이고 개발자들이 Looker를 새로운 영역으로 확장할 수 있도록 지원합니다.개발자로서 여러분은 연결의 안정성, 데이터의 정확성, 그리고 코드의 일관된 실행을 중요하게 생각합니다. 그리고 만약 그렇지 않을 때, 빌드가 왜 실패했는지 알아내거나 자신의 도구에 접근할 수 없는 사용자들의 불만을 듣는 데 오랜 시간을 소비하고 싶지 않을 것입니다.Looker를 위한 지속적 통합은 코드 개발 워크플로우를 간소화하고, 최종 사용자 경험을 향상시키며, 변경 사항을 더 빠르게 배포하는 데 필요한 자신감을 제공합니다.지속적 통합을 사용하면 LookML 코드를 작성할 때에도 대시보드가 손상되지 않고 Looker 콘텐츠가 데이터베이스 변경으로부터 보호됩니다. 이는 사용자가 데이터 불일치를 발견하기 전에 이를 미리 감지하는 데 도움이 되며, Looker 환경에서 직접 강력한 개발 유효성 검사 기능을 제공합니다.지속적 통합을 통해 데이터 파이프라인, 모델, 보고서 및 대시보드에 대한 변경 사항을 자동으로 통합하여 비즈니스 인텔리전스(BI) 자산이 지속적으로 정확하고 신뢰할 수 있도록 보장할 수 있습니다. 개발자들은 코드 품질을 유지하고, 신뢰성을 보장하며, 콘텐츠를 효과적으로 관리하는 데 도움이 되는 도구의 혜택을 받습니다. 조직 내에서 Looker가 널리 채택되어 더 많은 사용자가 새로운 대시보드와 보고서를 만들고 더 많은 데이터 소스에 Looker를 연결함에 따라 데이터 및 콘텐츠 오류의 잠재력이 증가할 수 있습니다.지속적 통합은 새로운 코드가 프로덕션에 푸시되기 전에 사전 테스트를 수행하여 강력한 사용자 경험과 성공을 보장하는 데 기여합니다.구체적으로, Looker의 지속적 통합은 다음을 제공합니다: 조기 오류 감지 및 데이터 품질 향상: 프로덕션 환경에서 예상치 못한 오류를 최소화합니다. Looker의 새로운 지속적 통합 기능은 LookML 개발자들이 새로운 코드 변경 사항이 배포되기 전에 문제를 파악하여 더 높은 데이터 품질을 확보할 수 있도록 돕습니다.다음 기능을 제공하는 검증 도구(Validators):Looker의 차원(dimension) 및 측정(measure) 정의를 손상시킬 수 있는 업스트림 SQL 변경 사항을 표시합니다.오래된 LookML 정의를 참조하는 대시보드 및 Look을 식별합니다.다른 유효성 검사의 일부로 LookML의 오류 및 안티패턴을 검증합니다.향상된 개발자 효율성: 워크플로우를 간소화하고 지속적 통합 파이프라인을 통합하여, 코드 품질 및 종속성을 자동으로 확인하는 보다 효율적인 개발 및 코드 검토 프로세스를 통해 영향력 있는 데이터 경험 제공에 집중할 수 있습니다.배포에 대한 신뢰도 향상: 프로젝트가 철저히 테스트되었음을 알고 LookML 코드, SQL 쿼리 및 대시보드가 견고하고 신뢰할 수 있다는 확신을 갖고 배포할 수 있습니다. Looker 내에서 직접 지속적 통합 관리 이제 Looker는 단일 통합 UI 내에서 지속적 통합 테스트 스위트, 실행, 그리고 관리자 구성을 관리할 수 있도록 해줍니다. 이를 통해 다음을 수행할 수 있습니다.Looker 내에서 지속적 통합 실행 상태를 쉽게 모니터링하고 테스트 스위트를 직접 관리할 수 있습니다.강력한 검증 도구를 활용하여 SQL 쿼리, LookML 코드 및 콘텐츠의 정확성과 효율성을 보장할 수 있습니다.필요할 때마다 수동으로 또는 풀 리퀘스트(pull requests)나 스케줄을 통해 지속적 통합 실행을 자동으로 트리거하여 테스트 프로세스를 제어할 수 있습니다.오늘날 빠르게 변화하는 데이터 환경에서 속도, 정확성, 그리고 신뢰는 매우 중요합니다.Looker의 지속적 통합은 데이터 팀이 개발 모범 사례를 추진하고, 프로덕션에 오류를 도입할 위험을 줄이며, 조직의 데이터에 대한 신뢰를 높이는 데 도움을 줍니다. 그 결과, LOB(Line-of-Business) 사용자를 포함한 모든 사용자에게 지속적으로 신뢰할 수 있는 Looker 경험을 제공하여 모든 사용 사례에서 신뢰성을 높입니다. Looker의 지속적 통합은 현재 프리뷰(미리보기)로 제공됩니다. 출처 https://cloud.google.com/blog/products/business-intelligence/introducing-continuous-integration-for-looker?hl=en 2025년 07월 24일
에이전트 개발 키트: 멀티 에이전트 애플리케이션 개발 간소화 구글 인사이트 by Miyeon. Jo 2025년 07월 10일 AI의 세계는 단일 목적 모델을 넘어 지능적이고 자율적인 멀티 에이전트 시스템으로 빠르게 이동하고 있습니다. 그러나 이러한 멀티 에이전트 시스템 개발에는 새로운 과제가 수반됩니다. 그래서 오늘 저희는 Google Cloud NEXT 2025에서 ADK(에이전트 개발 키트)를 선보였습니다. ADK는 에이전트 및 멀티 에이전트 시스템의 풀 스택 엔드 투 엔드 개발을 단순화하도록 설계된 Google의 새로운 오픈소스 프레임워크입니다. ADK는 개발자가 더 큰 유연성과 정밀한 제어로 바로 프로덕션 환경에 사용할 수 있는 에이전틱 애플리케이션을 개발할 수 있도록 지원합니다.ADK는 Agentspace 및 Google CES(Customer Engagement Suite)와 같은 Google 제품 내에서 에이전트를 구동하는 프레임워크와 동일합니다. 오픈소싱 ADK를 통해, 빠르게 변화하는 에이전트 환경에서 개발자에게 개발을 위한 강력하고 유연한 도구를 제공하는 것이 목표입니다. ADK는 유연성이 뛰어나고 다양한 모델을 사용하며 다양한 배포 환경에 맞게 프로덕션 환경에서 바로 사용할 수 있는 에이전트를 개발할 수 있도록 설계되었습니다.ADK의 핵심 요소: 개발, 상호작용, 평가, 배포ADK는 전체 에이전트 개발 수명 주기 전반에 걸쳐 다음과 같은 기능을 제공합니다.디자인 단계부터 멀티 에이전트 제공: 여러 전문 에이전트를 계층적으로 구성하여 확장 가능한 모듈식 애플리케이션을 개발해 보세요. 복잡한 조정과 위임을 활성화하세요.풍부한 모델 생태계: 필요에 가장 적합한 모델을 선택하세요. ADK는 Gemini든 Vertex AI Model Garden을 통해 액세스할 수 있는 모델이든 여러분이 선택한 모델과 함께 작동합니다. 이 프레임워크는 또한 LiteLLM 통합을 제공하므로 Anthropic, Meta, Mistral AI, AI21 Labs 등 다양한 공급자가 제공하는 여러 모델 중에서 선택할 수 있습니다!풍부한 도구 생태계: 에이전트에 다양한 기능을 제공해 보세요. 사전 구축된 도구(Search, Code Exec)나 MCP(Model Context Protocol) 도구를 사용하거나, 타사 라이브러리(LangChain, LlamaIndex)를 통합하거나, 다른 에이전트를 도구(LangGraph, CrewAI 등)로 사용할 수도 있습니다.기본 제공 스트리밍: ADK 고유의 양방향 오디오 및 동영상 스트리밍 기능을 사용하여 실제 사람과의 대화에서처럼 에이전트와 상호작용할 수 있습니다. 코드 몇 줄 만으로 에이전트와 작업하는 방식을 바꾸는 자연스러운 상호작용을 만들 수 있습니다. 즉, 단순한 텍스트를 넘어 풍부하고 다양한 대화로 넘어갈 수 있습니다.유연한 조정: 예측 가능한 파이프라인을 위해 워크플로 에이전트(Sequential, Parallel, Loop)를 사용하여 워크플로를 정의하거나 적응형 동작을 위해 LLM 기반 동적 라우팅(LlmAgent 전송)을 활용할 수 있습니다.통합 개발자 환경: 강력한 CLI와 시각적 Web UI로 로컬에서 개발, 테스트, 디버깅할 수 있습니다. 이벤트, 상태 및 에이전트 실행을 단계별로 검사할 수 있습니다.기본 제공 평가: 사전 정의된 테스트 사례에 대한 최종 응답 품질과 단계별 실행 경로를 모두 분석하여 에이전트 성과를 체계적으로 평가할 수 있습니다.손쉬운 배포: 에이전트를 컨테이너화하고 어디서나 배포할 수 있습니다.첫 번째 에이전트 시작하기docs의 예제를 살펴보도록 권하지만 핵심 아이디어는 Python의 단순함입니다. 여러분이 에이전트의 논리, 에이전트가 사용할 수 있는 도구, 에이전트가 정보를 처리하는 방식을 정의하면 됩니다. ADK는 상태를 관리하고, 도구 호출을 조정하고, 기본 LLM과 상호작용할 수 있는 구조를 제공합니다. 다음은 기본 에이전트를 보여주는 예시입니다.코드는 빠른 시작 가이드에서 찾을 수 있습니다from google.adk.agents import LlmAgent from google.adk.tools import google_Search dice_agent = LlmAgent( model="gemini-2.0-flash-exp", # 필수: LLM 지정 name="question_answer_agent", # 필수: 고유한 에이전트 이름 description="A helpful assistant agent that can answer questions.", instruction="""Respond to the query using google search""", tools=[google_search], # 도구의 인스턴스 제공 ) # adk web을 사용하여 실행할 수 있음Python이 간단한 예는 기본 구조를 보여줍니다. ADK가 진정으로 빛을 발하는 순간은 일관되게 제어 상태를 유지하면서도 여러 에이전트와 정교한 도구 사용, 동적 조정이 관련된 보다 복잡한 애플리케이션을 개발할 때입니다.ADK는 에이전트와 상호작용하는 방식(CLI, Web UI, API Server, API(Python))을 유연하게 변경할 수 있습니다. 에이전트를 정의하는 방식(agent.py 내의 핵심 논리)은 에이전트와 상호작용을 위해 선택하는 방식에 관계없이 동일합니다. 차이점은 상호작용을 시작하고 관리하는 방법에 있습니다. ADK 설명서에서 그 모든 예를 찾을 수 있습니다.ADK architectureADK를 사용한 멀티 에이전트 애플리케이션 개발ADK는 단일 에이전트를 넘어 도구를 활용하는 협업 멀티 에이전트 시스템을 개발할 때 그 진가를 발휘합니다. 기본 에이전트가 대화를 바탕으로 작업을 위임할 수 있는 전문 에이전트 팀을 만든다고 상상해 보세요. ADK를 사용하면 계층 구조와 지능형 라우팅을 통해 이를 쉽게 수행할 수 있습니다.예시를 살펴보겠습니다. 날씨 관련 쿼리를 처리하는 WeatherAgent가 인사말을 전문 GreetingAgent에 위임하는 예입니다.1. 도구 정의: 에이전트는 도구를 사용하여 작업을 수행합니다. 여기서 WeatherAgent는 날씨 데이터를 가져올 도구가 필요합니다. 우리가 Python 함수를 정의하면 ADK는 docstring을 사용하여 이 함수를 언제 어떻게 사용할지 이해합니다.def get_weather(city: str) -> Dict: # 모범 사례: 더욱 쉬운 디버깅을 위한 도구 실행 기록 print(f"--- Tool: get_weather called for city: {city} ---") city_normalized = city.lower().replace(" ", "") # 기본 입력 정규화 # 단순화를 위한 모의 날씨 데이터(1단계 구조와 일치) mock_weather_db = { "newyork": {"status": "success", "report": "The weather in New York is sunny with a temperature of 25°C."}, "london": {"status": "success", "report": "It's cloudy in London with a temperature of 15°C."}, "tokyo": {"status": "success", "report": "Tokyo is experiencing light rain and a temperature of 18°C."}, "chicago": {"status": "success", "report": "The weather in Chicago is sunny with a temperature of 25°C."}, "toronto": {"status": "success", "report": "It's partly cloudy in Toronto with a temperature of 30°C."}, "chennai": {"status": "success", "report": "It's rainy in Chennai with a temperature of 15°C."}, } # 모범 사례: 도구 내에서 잠재적 오류를 적절하게 처리 if city_normalized in mock_weather_db: return mock_weather_db[city_normalized] else: return {"status": "error", "error_message": f"Sorry, I don't have weather information for '{city}'."}Python2. 에이전트 및 에이전트의 관계 정의: LlmAgent를 사용하여 에이전트를 생성합니다. 지시문 및 설명 필드에 각별히 주의하세요. LLM은 역할을 이해하고 하위 에이전트에 대한 자동 위임을 사용한 위임 결정을 내릴 때 이들 필드에 크게 의존합니다.greeting_agent = Agent( model=LiteLlm(model="anthropic/claude-3-sonnet-20240229"), name="greeting_agent", instruction="You are the Greeting Agent. Your ONLY task is to provide a friendly greeting to the user. " "Do not engage in any other conversation or tasks.", # 위임에 중요한 점: 기능에 대한 명확한 설명 description="Handles simple greetings and hellos", ) farewell_agent = Agent( model=LiteLlm(model="anthropic/claude-3-sonnet-20240229"), name="farewell_agent", instruction="You are the Farewell Agent. Your ONLY task is to provide a polite goodbye message. " "Do not perform any other actions.", # 위임에 중요한 점: 기능에 대한 명확한 설명 description="Handles simple farewells and goodbyes", ) root_agent = Agent( name="weather_agent_v2", model="gemini-2.0-flash-exp", description="You are the main Weather Agent, coordinating a team. - Your main task: Provide weather using the `get_weather` tool. Handle its 'status' response ('report' or 'error_message'). - Delegation Rules: - If the user gives a simple greeting (like 'Hi', 'Hello'), delegate to `greeting_agent`. - If the user gives a simple farewell (like 'Bye', 'See you'), delegate to `farewell_agent`. - Handle weather requests yourself using `get_weather`. - For other queries, state clearly if you cannot handle them.", tools=[get_weather], # 루트 에이전트에는 여전히 날씨 도구가 필요함 sub_agents=[greeting_agent, farewell_agent] ) Python위임의 작동 방식:기본 에이전트 동작은 위임을 허용하는 것입니다.사용자 메시지를 처리할 때 LLM은 쿼리와 현재 에이전트의 description, 관련 에이전트(계층 구조에 정의된 상위/하위 에이전트)의 description 필드를 고려합니다.LLM이 해당 설명을 바탕으로 다른 에이전트가 더 적합하다고 판단하는 경우(예: 사용자가 GreetingAgent 설명과 일치하는 “Hi”라고 말하는 경우) 전송을 시작합니다.분명하고 확실한 설명이 무엇보다도 중요합니다! LLM은 설명을 사용하여 작업을 효과적으로 라우팅합니다.이 설정에서 사용자가 “Hi”로 시작하는 경우 WeatherAgent(입력을 처리하는 루트 에이전트인 경우)는 날씨 쿼리가 아님을 인식하고, 설명을 통해 GreetingAgent가 적합한지 확인하며, 자동으로 컨트롤을 전송할 수 있습니다. 사용자가 “What’s the weather in Chicago?”(시카고의 날씨는 어떤가요?)라고 물으면 WeatherAgent는 get_weather 도구를 사용하여 이 질문을 직접 처리합니다.이 예는 ADK의 계층적 구조와 설명 중심의 위임을 통해 어떻게 체계적이고 유지 관리 가능하며 정교한 멀티 에이전트 애플리케이션을 개발할 수 있는지 그 방법을 보여줍니다.수명 주기 완료: 평가 및 배포날씨 에이전트와 같은 지능형 에이전트 개발은 기본적인 것입니다. 하지만 이를 사용자에게 안정적으로 제공하기 위해서는 엄격한 평가와 원활한 배포라는 중요한 다음 단계를 거쳐야 합니다. 실제로 가동하기 전에 에이전트가 예측 가능하고 올바르게 작동하도록 하는 것이 가장 중요합니다. ADK의 통합 평가 도구는 바로 이런 목적에 딱 맞게 설계되어 있어, evaluation.test.json 또는 test.json 같이 사전 정의된 데이터 세트를 기준으로 실행 경로와 응답 품질을 체계적으로 테스트할 수 있습니다. AgentEvaluator.evaluate()를 사용하여 테스트 세트 내에서 프로그래밍 방식으로 이러한 검사를 실행할 수 있습니다. ADK eval 명령줄 도구 또는 웹 UI를 통해 직접적으로 평가를 사용할 수도 있습니다.성능에 만족할 경우 ADK는 모든 컨테이너 런타임에 배포하는 옵션을 통하거나 또는 Vertex AI Agent Engine과의 통합을 사용해서 프로덕션으로 진행하는 명확하고 간소화된 경로를 제공합니다. 이를 통해 완벽하게 관리되고 확장 가능한 엔터프라이즈급 런타임을 활용하여 개발 수명 주기를 완료하고 정교한 프로토타입에서 강력하고 프로덕션 환경에 바로 사용할 수 있는 에이전틱 애플리케이션으로 전환할 수 있습니다.내게 적합한 프레임워크 선택: ADK냐 Genkit이냐?ADK를 사용한 멀티 에이전트 시스템 개발의 가능성을 탐색하면서 ADK가 Google에서 제공하는 GenAI 개발 도구의 더욱 광범위한 환경에 어떻게 부합하는지 궁금하실 수도 있습니다. Genkit 프레임워크와 같은 다양한 SDK와 프레임워크가 사용 가능하지만 ADK가 상대적으로 어디에 포커스를 두고 있는지 이해하면 알기 쉽습니다. 간단히 비교해보자면 다음과 같습니다.에이전트 개발 키트:복잡한 에이전트와 멀티 에이전트 시스템에 최적화된 ADK는 다양한 모델을 지원하는 LiteLLM과 Vertex AI Model Garden에 대한 기본 통합을 통해 에이전트 개발을 위한 더 높은 수준의 추상화를 제공합니다.에이전트의 동작과 상호작용을 정의하는 데 중점을 둡니다.양방향 스트리밍을 지원합니다.Genkit:매우 다양한 AI 기반 경험을 구축하기 위한 기본 구성 요소를 제공합니다.AI 관련 상호작용을 반복, 테스트, 디버깅하기 위한 개발자 도구를 포함합니다.커뮤니티 플러그인을 통해 Google AI, Vertex AI 및 타사의 다양한 대형 언어 모델을 지원합니다.적합한 도구 선택결국, 최선의 선택은 프로젝트의 구체적인 목표에 달려 있습니다. 잘 정의된 프레임워크 내에서 복잡한 협업 에이전트 시스템을 개발할 경우 ADK는 강력한 솔루션을 제공합니다. 유연성과 광범위한 모델 지원이 필요한 다른 많은 GenAI 프로젝트에는 Genkit이 탁월한 선택입니다.어디에서나 작동하지만 Google Cloud에 최적화된 ADKADK는 다양한 도구와 연동해 작동할 수 있는 유연성을 제공하지만, Google Cloud 생태계 내에서, 특히 Gemini 모델 및 Vertex AI와 원활하게 통합되도록 최적화되어 있습니다. 개발자는 이러한 맞춤형 설계를 통해 Gemini 2.5 Pro Experimental에서 볼 수 있는 향상된 추론이나 도구 사용 같은 Gemini의 고급 기능을 최대한 활용할 수 있습니다. 이 맞춤형 설계는 또한 확장성을 위해 이러한 에이전트를 Vertex AI의 완전 관리형 엔터프라이즈급 런타임에 배포할 수 있는 직접적인 기본 경로를 제공합니다.결정적으로, 이러한 심층적인 통합은 더 광범위한 엔터프라이즈 환경으로 확장됩니다. 에이전트는 ADK를 사용하여 사전 구축된 100개 이상의 커넥터를 통해 시스템과 데이터에 직접 연결하고, Application Integration으로 구축된 워크플로를 활용하며, 데이터를 중복할 필요 없이 AlloyDB, BigQuery, NetApp 등의 시스템에 저장된 데이터에 액세스할 수 있습니다.또한 ADK로 개발된 에이전트는 Apigee를 통해 관리되는 조직의 기존 API 투자를 안전하게 활용할 수 있으며, 이미 확립된 인터페이스를 활용하여 기능을 더욱 향상시킬 수 있습니다.고급 AI 모델과 확장 가능한 배포, 다양한 데이터 소스, 기존 API를 아우르는 이러한 포괄적인 연결성 덕분에 ADK는 Google Cloud 환경 내에서 사용될 때 매우 강력해집니다.ADK로 차세대 에이전트 개발ADK는 차세대 AI 애플리케이션 개발을 위한 강력하고 유연한 오픈소스 기반을 제공합니다. ADK는 다음을 제공하여 멀티 에이전트 개발의 핵심 과제를 해결합니다.에이전트 동작 및 조정에 대한 정확한 제어.도구와 통합을 위한 풍부한 생태계.빌드와 디버깅을 위한 통합 개발자 경험.신뢰할 수 있는 에이전트에 필수적인 강력한 평가 프레임워크.관리형 옵션을 포함한 배포에 대한 명확한 경로. 출처 Google for Developers 2025년 07월 10일