mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-11-22 21:47:53

Gemini(앱)

바드(구글)에서 넘어옴


파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
Gemini 모델에 대한 내용은 Gemini(인공지능 모델) 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · o1 · LLaMA · Gemma · Claude · Phi · Exaone
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
멀티모달 모델 기반
대화형
+이미지
Exaone 3.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위/동작 [[지능형 에이전트|
에이전트
]] Apple Intelligence · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

대화형 인공지능 서비스의 목록
{{{#!wiki style="margin:0 -10px -5px; min-width:300px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
인공지능 컴패니언 이루다 2.0 · 강다온 · 허세중 · Neuro-sama · 라디안 · 냥아지 · 쿠로냥아지
페르소나 채팅 플랫폼 Character.AI · RisuAI · CAVEDUCK · Myshell.ai · Rolp.ai · zeta · 티카 · Babechat.ai · SpeakEasy · 뤼튼 · GPTRPG
LLMs 대화형 ChatGPT · Microsoft Copilot · Gemini · CLOVA X · 어니봇 · YouChat · Cue: · Pi · Le Chat · 삼성 가우스 }}}}}}}}}

<colbgcolor=#4991e6><colcolor=#fff>
Gemini
제미나이
파일:Gemini(앱) 아이콘.svg 파일:Gemini(앱) 로고.svg
개발사 구글[1]
기능 대화형 인공지능
기반 언어모델 LaMDA, PaLM 2, Gemini
출시일
초기 베타
2023년 3월 21일
안정화 베타
2023년 5월 15일
리브랜딩
2024년 2월 8일
지원 언어 한국어 포함 47개 언어[2]
서비스 일부 유료
라이선스 Proprietary SW
링크 파일:홈페이지 아이콘.svg | 파일:Google Play 아이콘.svg | 파일:App Store 아이콘.svg

1. 개요2. 특징 및 인터페이스
2.1. 모바일 앱
3. 역사
3.1. 공개3.2. 테스트 기간3.3. 리브랜딩
4. 공개 후 평가
4.1. Bard
4.1.1. 긍정적 평가4.1.2. 부정적 평가
4.2. Gemini
4.2.1. 긍정적 평가4.2.2. 부정적 평가
5. 문제 및 사건사고
5.1. 시연 실패와 주가 폭락
6. 기타

[clearfix]

1. 개요

구글 대형 언어 모델(LLM) LaMDA PaLM, Gemini 을 기반으로 하는 인공지능 검색 엔진 서비스.[3] 2023년 3월 21일에 미국 영국을 대상으로, 영어 버전으로 베타 테스트를 시작했고, 2023년 5월 15일부터는 PaLM 2 언어 모델을 탑재하고 한국어 일본어를 추가해 전세계 180개국에서 세 가지 언어로 이용할 수 있는 안정화 버전을 출시했다. 2023년 7월 13일부터는 46개 언어로 이용이 가능하다.

Gemini를 사용하려면 만 14세 이상의 Google 계정이 있어야 한다. #

2023년 12월 6일부터 Gemini 프로가 탑재된다고 밝혔다. #

2024년 2월 8일부터 Bard에서 Gemini로 리브랜딩하며 Gemini Ultra를 적용한 유료 서비스인 Gemini Advanced를 사용할 수 있게 되었다.

2. 특징 및 인터페이스

구글의 서비스인만큼, 구글 계정으로 로그인하여 사용할 수 있다. 기존 챗봇과 동일하게 프롬프트를 입력하여 질문하고 답변을 받는다. 프롬프트 입력란 오른쪽에 있는 마이크 사용 아이콘을 클릭하여 프롬프트 입력을 마이크로도 할 수 있다.

Gemini는 한 질문에 대해 3가지의 답안을 제공한다. 원하는 질문의 답변에 충족하는 답안을 선택할 수 있고, 답안을 선택한 후 대화를 진행하면 선택한 답안으로 기억하며 변경할 수 없다. 다른 답안도 마음에 들지 않는다면, 오른쪽에 있는 답안 재생성 버튼을 클릭하면 답변을 다시 생성할 수 있다. 또한, 답변을 구글 독스 Gmail로 내보낼 수 있다. 대답 내보내기 버튼을 클릭 후 원하는 내보내기 형식을 선택하면 된다.

Python 언어와 관련한 답변에서는 Colab이나 replit[4]으로 코드를 바로 내보낼 수 있다. 코드를 내보낼 수 있다면, 내보내기 형식 중에 Colab으로 내보내기나 Replit으로 내보내기 버튼이 생성된다. 코드를 내보내고 Colab이나 Replit에서 Gemini가 제공한 코드를 바로 실행해볼 수 있다.

Gemini Advanced 전용 기능으로 제공하는 코딩 기능을 통해, Python 언어와 관련한 답변에서 생성된 코드를 인터페이스에서 바로 수정하고 실행할 수 있다. GPT-4처럼 생성된 코드가 원하는 대로 작동하는지 즉시 검증할 수 있다.

Gemini가 생성한 구글 스프레드시트로도 내보낼 수 있다. Gemini가 제공한 표 하단에 Sheets로 내보내기 버튼을 클릭하면 구글 스프레드시트에 표의 데이터를 그대로 내보내 준다.

Google에서 검색 버튼을 클릭하면 질문 및 답변과 관련된 주제의 관련 검색어를 확인할 수 있다.

ChatGPT와 동일하게, 답변이 마음에 들지 않으면 대답이 마음에 들어요(👍) 또는 대답이 마음에 들지 않아요(👎) 아이콘을 클릭하여 평가를 전송할 수 있다.

파일:스크린샷 2023-05-24 04.16.26.png
2023년 5월 23일 구글 검색을 활용해 이미지 자료를 가져오는 기능이 업데이트되었다. Gemini가 질문에 맞는 이미지를 가져오거나, 사용자가 직접 이미지 자료를 요청하여 이미지를 받을 수 있다.

2023년 7월 13일에는 답변을 TTS로 읽어주는 기능이 추가되었다. 답변의 오른쪽 상단 구석에 TTS 아이콘을 클릭하면 언어에 맞게 읽어준다. 이 외에도 많은 기능이 업데이트되었는데, 대화 목록과 질문 수정, 링크 공유 기능 등이 새롭게 추가되었고 이 기능들은 ChatGPT 내에 있는 기능들과 포맷이 같다.

2023년 9월 19일에는 답변을 구글 검색을 기반으로 정확성을 평가해주는 기능과 확장 프로그램이 추가되었다. [G] 버튼을 누르면 자동으로 답변의 내용을 구글로 검색한 후 신뢰할 만한 내용은 초록색으로, 관련 자료가 없거나 사실과 다른 내용은 빨간색으로 표시된다. [PC] 확장프로그램은 드라이브, 지메일, 구글지도, 유튜브등 구글의 서비스에 연동하여 질문을 하면 Gemini가 알아서 알맞는 확장을 고르고, 해당 확장을 답변에 사용하는 방식이다.

또한 이미지를 프롬프트와 같이 업로드하는 기능이 추가되어 Gemini에 이미지를 보여주고 답변을 요청할 수 있게 되었다. 예를 들면, 광화문 광장의 이미지를 업로드하고 어디인지 물었을 때 Gemini가 '서울의 광화문 광장으로 보인다'고 답하는 식이다.

2024년 2월 1일부터 Gemini Pro 기반 Gemini의 지원이 전 세계로 확대되어 Gemini가 지원되는 모든 언어새 창에서 열기에서 사용 가능해졌다. 이러한 업그레이드를 통해 Gemini가 이해, 요약, 추론, 브레인스토밍, 작문, 계획과 같은 작업을 더욱 잘 처리할 수 있게 되었다. 또한 영어로 이용할 경우 이마젠2(Imagen 2)를 이용하여 바드에서 그림을 생성할 수 있다.

2024년 2월 8일 기존의 Bard에서 Gemini로 리브랜딩하며 유료 멤버십을 필요로 하는 Gemini Advanced를 출시하였다.

최대 3년간 대화내용을 보관한다.[6]

2.1. 모바일 앱

2024년 4월 30일부터 한국에서 사용이 가능해졌다. 안드로이드에서는 플레이 스토어에서 앱을 다운로드하면 되며, 기존 구글 어시스턴트를 대체하게 된다.

아직까지는 구글 어시스턴트 기능을 Gemini에 통합한 정도에 불과하다. 따라서 기존 구글 어시스턴트 기능은 그대로 유지되며[7], 구글 어시스턴트 동작 목록에 없는 명령에 한해 생성형 인공지능을 이용해 답변해준다. "오케이 구글"이라고 불러서 깨우는 기능도 그대로 들어갔다. [8]

Gemini 앱에서 어시스턴트 대신 Gemini를 사용하는 것으로 선택해야 쓸 수 있으며, 언제든지 기존의 구글 어시스턴트로 되돌릴 수 있다.

앱이 출시되며 생긴 가장 큰 장점은 웹페이지에 번거롭게 접속할 필요 없이 음성 명령 만으로 생성형 인공지능 답변을 들을 수 있다는 것이다.

다만 답변까지 걸리는 시간이 길고, 구글 어시스턴트에서는 되는 기능들도 Gemini에서는 제대로 되지 않는 등 아직 문제점이 많다.

2024년 11월 14일에 iOS용 Gemini 앱이 출시되었다.

3. 역사

3.1. 공개

구글에서 2023년 2월 6일 기사로 공개했는데, 몇 주 간의 테스트 후 자사 검색엔진에 추가하겠다고 발표했다. # ChatGPT 2022년 11월 30일에 공개됐고, 마이크로소프트에서 GPT를 결합한 검색 엔진인 New Bing을 공개한다고 하자 구글에서도 그 대항마 격으로 내놓았다.

3.2. 테스트 기간

구글이 미국과 영국의 일반 사용자를 대상으로 Gemini의 테스트를 시작했다. New Bing 초창기와 마찬가지로 Waitlist에 등록하고 구글로부터 승인 이메일을 받으면 사용해볼 수 있다. # 4월 23일부로 한국에서도 사용이 가능해졌으며, 5월 10일에 한국어와 일본어를 지원하게 되면서 한국어로도 사용이 가능하다. 관련기사

3.3. 리브랜딩

2024년 2월 8일, Bard의 명칭이 Gemini(제미나이)로 명칭이 변경하며 기능을 더욱 확장했다. # 또한 Gemini Ultra를 기반으로한 Gemini Advanced를 출시하였다. Gemini Advanced는 별도의 AI Premium Google One 요금제 구독하여야 이용가능하다.

안드로이드 iOS에서 이용가능한 Gemini앱을 출시하였으며 안드로이드는 Gemini앱을 직접 다운받으면 구글 어시스턴트를 대신하여 디지털 어시스턴트로 사용 가능하고 iOS는 기존 구글 앱을 업데이트 하여 사용가능하다.

4. 공개 후 평가

4.1. Bard

기존 구글이 가지고 있던 강점인 검색과 크롤링 속도를 그대로 살려 정보를 한 문장으로 취합하는 것 까지는 성공했으나, ChatGPT에 비해 서사가 붙거나 독창성을 요하는 부분에서는 상대적으로 부족하다는 평가가 많다. 이는 검색엔진을 탑재했기에 문장들이 명확하게 정립되지 않은 이유가 큰데 같이 검색엔진을 탑재한 New Bing과도 비슷한 문제이다.[9]

시연회의 수모와 경쟁작들의 비판을 과하게 의식한 것으로 보인다. 독창성을 의도적으로 많이 제한해서 문제의 소지가 될 발언이 나올 여지를 아예 차단했고 정확하고 객관적인 답변만 제시하기 때문에 유저들 사이에서는 재미없다라는 반응도 많이 나오고 있다. 이전 ChatGPT나 빙 엔진보다 독창성과 참신함이 부족하고 AI 챗봇이 나온지 시간이 지났지만 새로운 바드만의 기능이 없기 때문이기도 하다.

다만 ChatGPT가 공개된 이후 성급하게 개발한 감도 있고, 본인들도 아직은 실험 단계라는 것을 주기적으로 강조하고 있기에 앞으로 어떻게 발전할지는 계속 지켜볼만한 내용이다. 한마디로 검색엔진으로서의 기능만 볼 때는 나름 쓸만한 수준은 맞지만, ChatGPT가 처음 공개됐을 때 수준의 파급력은 없다고 볼 수 있다.

2024년 2월, Bard의 명칭이 Gemini로 리브랜딩 되었다.

4.1.1. 긍정적 평가

4.1.2. 부정적 평가

4.2. Gemini

현재는 베이스 모델 업그레이드, 구글에서 지원하는 기능 통합[10], 여러가지 다른 AI 클라우드 챗봇과 차이점을 두는 기능추가 등등 여러번의 개선을 거친 현재는 AI 클라우드 서비스 챗봇중에서 ChatGPT, Microsoft Copilot 다음 가는 수준 정도의 위치는 한다고 볼 수 있고, 기존의 장점이던 속도와 정확도, 정보 크롤링이 개선 후 부각되며 오히려 두 챗봇보다 우월한 부분도 존재하게 되어서, 용도만[11] 맞다면 두 챗봇과 더불어 용도에 맞게 돌려가면서 쓰기에는 충분한 성능을 가지게 되었다.[12]

4.2.1. 긍정적 평가

4.2.2. 부정적 평가

5. 문제 및 사건사고

Gemini 앱의 문제 및 사건사고만 기록한 문단입니다. Gemini 앱을 이루는 Gemini 모델의 문제 및 사건사고에 대한 내용은 Gemini(인공지능 모델) 문서를 참고해 주세요.

5.1. 시연 실패와 주가 폭락

2023년 2월 8일 프랑스 파리에서 있었던 기술 시연에서 제임스 웹 우주 망원경이 이룬 성과에 대해 묻자 최초로 태양계 외부 행성을 촬영했다는 잘못된 답변을 내놓는 등 문제점이 부각되어, 구글의 모회사인 알파벳의 주가가 폭락해 시가 128조 원이 순식간에 증발하는 데에 기여했다는 평가를 받았다. 또한 Microsoft Copilot[13] 역시 웹에서 정보를 가져와 답변하기 때문에 ChatGPT와의 차별점마저 퇴색되고 말았다.

구글 내부에서도 바드에 대한 평가가 부정적으로 이어지자 선다 피차이는 직원들한테 하루 2~4시간 바드를 이용해달라고 요청했다. #

6. 기타



[1] 정확히는 구글 자사의 인공지능을 총괄하는 부서, Google AI에서 개발했다. [2] https://support.google.com/gemini/answer/13575153?hl=ko [3] LaMDA와 PaLM 둘 다 엔비디아가 아니라 자사 칩셋인 TPU를 기반으로 학습되었다. [4] Colab과 동일한 온라인 개발 IDE 서비스이다. [PC] PC 전용 기능 [6] OpenAI의 ChatGPT는 최대 30일까지만 보관한다. [7] 일부만 사용 가능 [8] 사실상 구글 어시스턴트와 제미나이 묶음 상품. [9] 그러나 현재는 창의적 답변 옵션을 선택하고 여러번 질문을 이어가면 상당히 신뢰성 높은 답변을 얻을 수 있어, 속도를 빼면 New Bing에 완벽하게 밀리는 상태이다. [10] 구글 렌즈, 음성 인식, 위치 엑세스등 [11] 속도, 정확성이 중요한 정보 크롤링 [12] 다만 처음 시연시에 지적받던 "재미가 없다"는 의견인 새로운 정보를 창작하는 독창성 부분에서는 아직 상대적으로 부족하다고 평가받는다. 정확히는 새로운 정보를 창조는 해도 그 창조한 정보의 융통성이 떨어진다. [13] 다만 코파일럿 또한 오류가 있었다고 뒤늦게 알려졌다.

파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r199
, 2번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r199 ( 이전 역사)
문서의 r ( 이전 역사)