Udio

생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"	텍스트	[[소설\| 소설 ]] NovelAI · AI Dungeon · AI 노벨리스트
대화형	[[챗봇\| 챗봇 ]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI
대화형	[[언어 모델\| 언어모델 ]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · ~~GPT-5~~ · LLaMA · Gemma · Claude
코드	[[코드#컴퓨터 소프트웨어\| 코드 ]] GitHub Copilot · Devin
그림/영상	[[그림 인공지능\| 그림 ]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · Gaugan2 · Dream by WOMBO · Adobe Firefly
	[[영상\| 영상 ]] Stable Video · Sora · Lumiere · Runway AI
	[[모델링\| 모델링 ]] LATTE3D
오디오/소리	[[음성\| 음성 ]] A.I.VOICE · DeepVocal · Voice Engine
오디오/소리	[[음악\| 음악 ]] Suno AI · Stable Audio · Udio · AIVA · SOUNDRAW · Mix.audio · vio.dio
멀티모달	[[멀티모달 모델\| 멀티모달 ]] 삼성 가우스 · Gemini
행위/동작	[[인공지능 로봇\| 로봇 ]] Robot Operating Syetem(ROS) · Google RT-X · 피규어 01 · 프로젝트 그루트	}}}}}}}}}

Udio 유디오

<colbgcolor=#e30b5d><colcolor=#fff> 출시일	베타 2024년 4월 10일
기능	음악 인공지능
지원 언어	한국어 지원[1][2]
사용처	자체 웹앱
라이선스	Proprietary SW
링크	\| \| \| \| \|

1. 개요2. 특징3. 구조4. 평가5. 반응6. 기타7. 관련 문서

[clearfix]

1. 개요

구글 딥마인드 출신 공학자들이 만든 오디오 및 음악 생성 인공지능. 간단한 프롬프트로 음악을 생성할 수 있다.

현재 사용자 급증으로 인한 서버 과부하 이슈를 겪고 있기는 하지만, 사람이 없는 시간대에는 40초만에 30초짜리 곡 2개를 금방 만들어낼 수 있다. 또한 곡 확장 기능을 이용해 곡의 길이를 더 늘릴 수도 있다.

구체적으로는 두 단계로 작업을 처리한다.
먼저 대형 언어 모델을 사용해 프롬프트를 기반으로 가사를 생성한다.
그 다음 Stability AI의 Stable Audio와 유사한 확산 모델(Diffusion)을 사용하여 음악을 생성한다. #

전체적인 음질이 매우 깔끔하며, AI가 생성한 듯한 느낌이 들지 않을 때도 많다. 또한 Suno AI에 비해 보컬 갈라짐 현상도 매우 적은 편이다.

곡의 전개나 흐름이 전혀 이상하지 않고 자연스럽다. 구글의 Music fx와 같은 모델은 음악의 흐름이 중구난방인데에 비해 Udio는 곡의 흐름이 납득이 갈 정도로 자연스럽다는 것을 느낄 수 있다.

윌아이엠은 “이것은 완전히 새로운 르네상스이며, 유디오는 이 시대의 창의성을 위한 도구다”라며 “유디오를 사용하면 AI와 상상력을 통해 노래를 존재하게 만들 수 있다”라고 극찬했다. #

레딧에는 "완전히 미쳤다" “정말 섬찟할 정도다” “이것이 무섭다고 생각하지 않는다면 당신은 자신에게 거짓말을 하고 있는 것” “작곡가에게는 죽음을 알리는 종소리” 등 놀라워하는 반응이 많다.

[1] 공식 사이트에는 한국어 지원에 대한 내용이 없지만, 한국어 가사로도 무난하게 곡 생성이 가능하다. [2] 이 외 지원 언어는 영어, 중국어, 일본어, 러시아어, 폴란드어, 독일어, 프랑스어, 이탈리아어