mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-12-18 16:41:14

Gemini(인공지능 모델)



파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
이 모델을 사용하는 인공지능 검색 엔진 서비스에 대한 내용은 Gemini(앱) 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
<colkeepall> 텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok · Xtion AI(액션 AI)
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · o1 · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오
소리
[[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
멀티모달 모델 기반
대화형
+이미지
Exaone 3.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위
동작
[[지능형 에이전트|
에이전트
]] Apple Intelligence · Project Astra · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

Gemini
_Ge_neralized _M_ultimodal _In_tell_i_gence Network
파일:geminiLogo.png 파일:geminiLogoDark.png
<colbgcolor=#51a2ca><colcolor=#fff> 개발사 구글 딥마인드
출시일
Gemini 1.0
2023년 12월 6일
Gemini 1.5
2024년 2월 15일
기능 멀티모달 모델 [1]
하드웨어 TPU v4, v5e
언어 영어, 한국어 등[2]
사용처 Gemini 앱[3][4], Google Cloud Platform[5], 최신 구글 픽셀 기기[6][N], 최신 삼성 갤럭시 기기[N][9]
라이선스 Proprietary SW
링크 파일:홈페이지 아이콘.svg

1. 개요2. 역사3. 특징
3.1. Gemini 1.03.2. Gemini 1.53.3. Gemini 2.0
4. 공개 후 평가
4.1. 긍정적 평가4.2. 부정적 평가
5. 논란 및 사건사고
5.1. 시연 영상 조작 논란5.2. PC주의 논란5.3. 데이터 무단 학습 벌금 부과 사건
6. 탑재 기기7. 기타8. 관련 문서

[clearfix]

1. 개요

파일:GeminiIntro.png

Gemini(Generalized Multimodal Intelligence Network, 이하 제미나이)는 구글 딥마인드가 개발한 멀티모달(LMM) 생성형 인공지능 모델이다. 텍스트뿐만 아니라 오디오, 이미지, 비디오와 같은 다양한 입출력을 지원한다. 이를 구글에서는 MMLU(Massive Multitask Language Understanding, 대규모 멀티태스킹 언어 이해) 분야 벤치마크를 기반해서 멀티모달 성능을 평가하며 소개하고 있다.

2. 역사

2023년 5월 10일, Google I/O 2023에서 Gemini 1.0 모델이 처음 공개되었다.

2023년 9월경, 일부 기업을 상대로 테스트가 시작되었다.

파일:gemini3combo.png

2023년 12월 6일 울트라, 프로, 나노로 구성된 세 가지 제미나이 모델을 전격 공개했다. 울트라는 2024년 Gemini Advanced로 적용되었으며 프로의 경우 Gemini 앱(구 바드)에 바로 적용되었다. 사이즈가 작은 나노의 경우 픽셀 등에 탑재되는 온디바이스 인공지능 전용 모델이다. #

2023년 12월 13일부터 Google AI Studio나 Google Cloud Vertex AI를 통해 다른 애플리케이션에서 모델 구동이 가능해졌다.

2024년 1월 18일 공개된 갤럭시 S24 시리즈에 일부 기능이 탑재되었다. 나노형 모델이 온디바이스로 내장되었다. #

2024년 2월 15일, Gemini 1.5가 공개되었다. #

3. 특징

파일:gemini_exs1.png

3.1. Gemini 1.0


파일:geminiGraph.png

3.2. Gemini 1.5

파일:Gemini1.5_tokens.png

3.3. Gemini 2.0

4. 공개 후 평가

4.1. 긍정적 평가

4.2. 부정적 평가

해당 부정적 평가에 대한 기준은 한국어를 기준으로 서술되어있습니다.

5. 논란 및 사건사고

5.1. 시연 영상 조작 논란


5.2. PC주의 논란

파일:geminiPC2.png
1820년대 독일 커플을 그려달라고 하자 흑인, 아메리카 원주민 등을 함께 그린 모습.

이용자가 질문을 입력하면 이 질문을 자체적으로 재해석해 과도하게 PC주의적인 출력값을 내놓는다는 게 출시 후 여러 이용자들 사이에서 확인 되었다. 구체적으로는 '중세 유럽 왕족들에 관한 이미지를 생성해줘' 같은 질문을 입력할 경우 여기에 자체적으로 중세 유럽 왕족을 백인이 아니라 흑인으로 묘사하는 이미지를 생성하는 식. 당연히 이 같은 사실이 확인되자 정치적 논란이 발생했고 추후 개발 총책임자(director)인 Jack Krawczyk의 트위터에서 PC주의를 맹목적으로 추종하는 내용의 트윗들이 다수 발견되어 논란은 더더욱 걷잡을 수 없을 만큼 커졌다.

이 외에도 역사적 사실의 왜곡[15], 역사적인 백인 위인들의 흑인화[16], 백인 남성의 긍정적 이미지 생성 요청에 대한 거부[17] 등등의 이상 행동을 보이더니 심지어는 백인 남성 미술가들의 화풍을 본딴 이미지의 생성을 거부까지 한다. '1940년대 미국인들의 삶을 묘사하는 그림들을 노먼 록웰 스타일로 생성해줘'라고 입력했을 때 나온 대답이 굉장히 기가 막힌데, '록웰은 당시 미국인들의 삶을 미화함으로써 당시의 인종, 성별, 사회 계급 등의 현실을 생략하거나 심각하지 않은 것처럼 치부한 작가이며 그런 스타일의 이미지를 생성하는 건 유해한 고정관념을 강화할 수 있기에 비윤리적이므로 생성할 수 없습니다.'란 답변이 나왔다. 참고로 노먼 록웰이 당시 서민들의 생활상을 주로 그려왔던 것은 사실이나 과장없이 담백한 사실주의에 가까운 화풍이 특징인데다 당시 기준으론 이례적으로 흑인 아이를 주 인물로 하여 그린 작품도 있어 인종차별주의자와는 거리가 먼 인물이다. 즉, 역사적으로 인종차별에 반대하는 입장에 섰던 백인들에게마저 굉장히 적대적인 스탠스를 취하고 있는 셈. Gemini: 네가 뭘 했건 백인으로 태어난 것만으로 너는 죄인이다

결국 일반 이용자들 뿐만 아니라 공공연히 대안 우파 성향을 보여온 기업인인 일론 머스크[18]까지 사회 각계각층으로부터 비난이 쇄도하자 구글 최고경영자인 선다 피차이는 아래와 같은 성명을 발표하고 Gemini의 이미지 생성 기능을 해당 현상이 해결될 때까지 중단 시키기로 결정하였다.

||<tablebordercolor=#a1c5d6,#fff><#a1c5d6,#fff>
파일:구글 아이콘.svg
||Gemini의 답변들 중 일부가 그 편향성으로 인해 이용자들을 불쾌하게 했다는 걸 잘 알고 있다. 용납할 수 없는 일이며 명백히 우리 측 과실이다. 이후 사태를 해결하기 위해 일련의 대응 조치들을 이어나갈 계획이다. 이 조치들에는 구조적 변화, 제품 가이드라인의 갱신, 제품 출시 절차의 개선, 여러 상황에도 안정적인 결과를 내는 평가 절차(robust evals)와 레드티밍[19], 그리고 기술 추천 등이 포함될 것이다.
I know that some of its responses have offended our users and shown bias — to be clear, that's completely unacceptable and we got it wrong. We'll be driving a clear set of actions, including structural changes, updated product guidelines, improved launch processes, robust evals and red-teaming, and technical recommendations.
선다 피차이 | 해당 인터뷰 기사

일각에서는 구글이 그토록 자랑해왔던 제미나이의 쿼리 처리 능력이 오히려 부작용의 원인이 된 것이 아니냐는 지적이 나온다. 정보 습득량이 많아질수록 정확도는 오히려 떨어지는 '과적합 현상(Overfitting Problem)으로 인해 AI 관련 업계가 골머리를 앓고 있는데 Gemini 역시 흑인에 대한 인종차별처럼 이미 역사적으로 '악하다'고 평가가 끝난 사상은 문제 없이 걸러낼 수 있어도 PC주의 같이 현재진행형으로 영향력을 발휘하며 사상에 대한 평가에 결론이 나지 않은 이념에 대한 정보들은 걸러내지 못 하다 보니 모델 자체가 오염된 것이 아니냐는 것.

5.3. 데이터 무단 학습 벌금 부과 사건

2024년 3월 20일, 프랑스 정부에서 구글에 2억 5천만 유로(약 3500억 원)의 벌금을 부과했다. 프랑스 언론들이 구글을 규제 기관에 고소한 결과 이러한 막대한 벌금이 부과된 것인데, 그 사유는 구글이 Gemini를 학습시킬 때 자신들의 콘텐츠를 사용했지만 이를 알리지 않았다는 것이다.
구글 측은 벌금이 혐의에 비해 너무 과하다는 입장을 밝혔지만 별도의 이의 없이 벌금을 납부했다.

6. 탑재 기기

7. 기타

8. 관련 문서


[1] GPT와 같은 텍스트 기반의 언어 모델과는 달리 처음부터 멀티모달로 개발되었다. [2] 1.5 버전 기준 한국어도 평균적인 원어민 이상의 지식을 갖추었고, 아메리카 원주민 언어 수준의 소수 언어도 번역이 가능하다. [3] Bard가 Gemini로 리브랜딩 되었다. [4] 앞으로 더 다양한 구글 플랫폼이 적용될 예정이다. [5] Vertex AI의 멀티모달 및 SDK [6] Google Pixel 8 시리즈 이상 [N] 나노 모델 [N] [9] 자세한 내용은 삼성 가우스 문서의 지원 기기 문단 참고 [10] Google Search, Google Books, Google Scholar 등. [11] 다만 일각에서는 이 측정 결과가 과장되었을 가능성이 있다고 주장하고 있다. 하정우 네이버클라우드 AI이노베이션 센터장은 "구글이 공개한 제미나이 MMLU 성능에서 GPT-4는 5-샷(문제 해결 예시 5개를 모델에 제시하고 문제를 푸는 방식)을 기준으로 한 반면 제미나이는 연쇄적 사고(CoT)로 (문제 풀이를 32번 반복하는) 'CoT@32'를 진행했기 때문에 공정한 비교가 아니다"라면서 제미나이 프로 버전은 GPT-3.5나 GPT-4 사이 수준으로 보인다고 말했다. [12] 구글 측 주장 [13] 물론 매개변수의 차이로 원래보다는 확실히 느린편이다. [14] 백만개 토큰 내에서 99% 시간 동안 포함된 텍스트를 발견 [15] 바이킹에 관한 이미지 생성을 요청했더니 흑인이나 아시아인들이 출력되질 않나 교황에 대한 이미지를 요청했더니 흑인이나 여성으로 묘사되는 등. 참고로 교황은 지금까지 한 명의 예외도 없이 전부 백인 남성이었다. [16] 미국의 국부인 조지 워싱턴의 이미지를 생성했더니 전부 흑인이 되어 나왔다. [17] '강한 백인 남성의 이미지를 생성해줘'라고 입력했더니 '인종과 체형에 관한 유해한 고정관념을 강화시킬 수 있기에 생성할 수 없습니다'라고 거부했다. 반면 '강한 흑인 남성의 이미지를 생성해줘'라고 입력했더니 정상 작동했다. [18] '구글 Gemini는 극도로 인종차별적이고 성차별적'이라고 비판하였다. [19] 조직적인 화이트 해킹을 시도하는 사내 조직을 말한다. [20] 구글 한국 법인에서는 공식적으로 영어식 발음인 '제미나이'로 표기한다.