Microsoft는 세 가지 새로운 기본 모델로 AI 경쟁자를 상대합니다.

이미지 출처:David Ryder/Bloomberg / Getty Images 오전 9시 48분(PDT) · 2026년 4월 2일 거대 기술 기업의 연구소인 Microsoft AI는 목요일에 텍스트, 음성 및 이미지를 생성할 수 있는 세 가지 기본 AI 모델 출시를 발표했습니다.이번 릴리스는 OpenAI에 여전히 묶여 있음에도 불구하고 자체 다중 모드 AI 모델 스택을 구축하고 경쟁 AI 연구소와 경쟁하려는 Microsoft의 지속적인 노력을 의미합니다.MAI-Transcribe-1은 25개 언어의 음성을 텍스트로 변환하며 Microsoft의 Azure Fast 제품보다 2.5배 빠릅니다.MAI-Voice-1은 오디오 생성 모델입니다.이 음성 모델을 사용하면 사용자는 1초에 60초 분량의 오디오를 생성하고 사용자 정의 음성을 만들 수 있습니다.MAI-Image-2는 비디오 생성 모델입니다.MAI-Image-2는 원래 3월 19일 새로운 대규모 언어 모델 테스트 소프트웨어인 MAI Playground에서 출시되었습니다. 이제 세 가지 모델 모두 Microsoft Foundry에서 출시되고 있으며 MAI Playground에서도 전사 및 음성 모델을 사용할 수 있습니다.이 모델은 2025년 11월에 결성되어 발표된 Microsoft AI의 CEO인 Mustafa Suleyman이 이끄는 AI 연구 팀인 Microsoft의 MAI Superintelligence 팀에 의해 개발되었습니다. Suleyman은 블로그 게시물에 "Microsoft AI에서 우리는 휴머니즘 AI를 구축하고 있습니다. 우리는 AI 모델을 만들 때 인간을 중심에 두고 사람들이 실제로 의사소통하는 방식을 최적화하며 실제 사용을 위한 교육을 하는 등 뚜렷한 관점을 가지고 있습니다"라고 썼습니다.“곧 Foundry에서 그리고 Microsoft 제품과 경험에서 직접 더 많은 모델을 볼 수 있게 될 것입니다.”점점 더 혼잡해지는 LLM 시장에서 MAI는 이러한 모델의 판매 포인트가 Google 및 OpenAI의 모델보다 저렴하기를 희망한다고 회사는 블로그 게시물에 썼습니다.