여기서잠깐! 중요한 내용을 알려드려요!
• 인간이 사물을 받아들이는 방식으로 학습하는 '멀티 모달 AI'
• AI의 미래를 보여주는 ‘DALL.E
• AI로 진화하는 미디어 멀티 모달 AI가 만드는 긍정적 경험
• AI, 창작의 영역에 발을 딛다, 미술 대회에서 1위를 차지한 AI 아티스트
• 'AI 르네상스'의 태동, 발달에 가속 붙은 AI, 새로운 시대는 곧 열릴까 |
인공지능은 성능이 뛰어난 프로그램 이상의 것입니다. 인공지능은 기계 학습, 딥 러닝, 자연어 처리, 컴퓨터 비전, 강화 학습 등 다양한 분야에서 적용되는 기술을 통해 데이터를 분석하고, 패턴을 파악하며, 문제를 해결하는 능력을 갖추고 있습니다. 이러한 능력은 전통적인 프로그램보다 더욱 정교하고 막강합니다.
첫 번째 목표 지점에 도달한 AI
미국의 AI 연구기관 'Open AI'는 일론 머스크를 비롯한 주도자들이 설립한 기관으로, 딥러닝을 활용한 AI 언어 모델을 개발하고 있습니다. 이는 인간이 소통과 기록을 위해 가장 많이 사용하는 수단인 언어를 이해하는 것에 중점을 두고 있습니다.
Open AI의 언어 모델인 'GPT-n' 시리즈는 언어를 분석하고 구사하는 능력이 뛰어나 AI의 기준이 되고 있습니다. 이러한 능력을 바탕으로 Open AI는 다양한 분야에서 인공지능 기술을 활용해 문제를 해결하고자 노력하고 있습니다.
GPT-2 | GPT-3 | GPT-4 |
2019년 공개
약 800만 건의 텍스트 데이터를 학습, 키워드를 입력하면 뉴스 기사, 소설, 에세이 등을 한 페이지 분량으로 작성하는 것이 가능 | 2020년 공개
GPT-3는 전 버전보다 학습 분야가 넓어지고 문장의 이해능력이 비약적으로 상승하여 사용자의 요구에 보다 정확한 답변을 제시 | 2023년 공개
‘튜링 테스트’는 AI가 인간과 얼마나 자연스럽게 소통할 수 있는지를 측정하는 기술 테스트, GPT-4는 이를 통과한 최초의 AI가 될 것이라 예상 |
인간이 사물을 받아들이는 방식으로 학습하는 '멀티 모달 AI'
멀티 모달 AI는 인간의 사물 인식 방식을 모방하여 학습하는 방식입니다. 이를 위해 멀티 모달리티(Multi Modality)라는 방식을 사용하는데, 이는 시각, 청각 등 다양한 양식의 정보를 AI에게 입력하는 방식을 말합니다.
이렇게 다양한 채널을 통해 입력된 정보를 기반으로 AI는 사물의 형태, 색상, 소리 등을 이해하고 분석하여 사용자의 의도와 목적을 더욱 정확하게 이해하고 대응할 수 있게 됩니다. 이를 통해 멀티 모달로 학습된 AI는 인간처럼 고차원적인 사고 회로를 갖게 되어 인간과 보다 유사한 인식 및 응답 능력을 갖게 됩니다.
AI 언어모델 | 멀티 모달AI | NEXT AI |
텍스트와 자연어 이해가 중점
인간이 일상적으로 사용하는 언어의 분석이 가능해야 질문을 이해하고 반응할 수 있으므로 텍스트와 일상 언어(자연어)를 이해하는 것에 중점 | 복합적인 정보를 수용하며
‘관계’를 이해
시각〮청각·동작 등 다양한 양식의 정보를 시스템의 기준에 따라 분류하고 각 속성을 이해, 정보를 설명하는 텍스트 간의 관계를 학습 | 더욱 높은 차원의 사고가 가능
멀티 모달을 통해 텍스트-이미지-속성 등의 관계를 파악하고 정보를 복합적으로 이해하며 지식 축적, 이는 AI가 상황을 종합적으로 해석할 수 있는 기반 |
AI의 미래를 보여주는 ‘DALL.E
멀티 모달 학습을 통해 제작의 영역부터 전문 영역까지 섭렵
최근에는 텍스트와 이미지를 모두 활용하여 AI 모델을 학습시키는 멀티 모달 AI 기술이 주목받고 있습니다. 이러한 기술의 대표적인 예로 Open AI에서 공개한 DALL-E 시리즈가 있습니다. DALL-E 2는 사용자가 입력한 텍스트를 이해하고 이에 맞는 이미지를 생성하는데, 이뿐만 아니라 이미지를 효과적으로 편집하는 기능도 지원합니다. 이러한 기술은 미래의 AI 기술 발전 가능성을 보여주며, 이미지 생성 및 편집 분야에서 많은 응용 가능성을 가지고 있습니다.
‘우주에서 말을 탄 우주 비행사’를 ‘사실적인 스타일’로 그려달라는 요청에 따라 달리-2가 제작한 이미지, 개념·속성·스타일 등 여러 요소를 복합적으로 적용 가능
붉은 사각형의 원작에 배경 요소를 더해 확장, 원본 이미지의 구성 요소, 분위기, 화풍 등을 분석해 원본 이미지와 연속성 높은 확장이 가능
편집 요소와 위치 등을 자연어로 지정하면 그림자, 반사, 질감을 고려해 요소를 자연스럽게 추가하거나 제거하는 것이 가능
AI로 진화하는 미디어
멀티 모달 AI가 만드는 긍정적 경험
멀티 모달 AI는 다양한 분야에서 긍정적인 경험을 제공할 수 있습니다. 국내외 빅테크 기업들 역시 멀티 모달 AI를 활용하여 서비스를 고도화하고 있습니다. 예를 들어, 큐레이션과 검색, 서비스 품질 등 사용자가 바로 체감할 수 있는 단계에 적용된 멀티 모달 AI는 뛰어난 사용자 경험을 제공할 수 있습니다.
또한, 만족도 높은 AI 서비스는 미디어 체류 시간 증대와 구매 전환 증대에 긍정적인 영향을 미칠 수 있습니다. 이러한 이유로 멀티 모달 AI는 사용자 경험 및 비즈니스 성과를 향상시키는데 큰 역할을 할 수 있습니다.
[META]
AI가 비디오 데이터와 사운드 데이터를 종합적으로 인식, 유사한 움직임을 보이는 비디오와 유사한 음악이 재생되는 비디오를 추천
[GOOGLE]
NAVER]
검색 시 입력한 키워드와 이미지를 분석하여 사용자의 검색 의도를 파악하고, 매칭 적합도가 높은 문서를 분류해 맞춤형 검색 결과로 제공
미술 대회에서 1위를 차지한 AI 아티스트
콜로라도 주립박람회 미술 대회에서 AI가 그린 디지털 아트가 1위를 차지한 결과에 대해 논란이 있었습니다.
제이슨 M. 앨런(39)이 AI 기술을 활용하여 제작한 작품 '스페이스 오페라 극장'(Theatre D'opera Spatial)이 콜로라도 주립 박람회 미술대회의 디지털아트 부문에서 발표되었습니다.
이 작품은 스페이스 오페라를 주제로 한 3D 시각화 작품으로, 우주의 다양한 장면들을 느껴볼 수 있도록 설계되어 있습니다. 관객들은 VR 기기를 통해 현실감 넘치는 우주 공간을 경험할 수 있으며, 공간에서는 오페라 공연을 관람할 수 있습니다.
제이슨 M. 앨런은 게임 기획자 출신으로, 이번 작품에서는 AI 기술을 사용하여 다양한 우주 장면들을 생성하였습니다. 이를 위해 제이슨은 AI 모델을 학습시켜 우주 장면을 생성하는 알고리즘을 개발하였으며, 이를 통해 고품질의 3D 시각화 작품을 제작할 수 있었습니다.
AI를 활용한 디지털 아트 작품은 미술계에서 점점 더 주목받고 있으며, 기술의 발전으로 더욱 창의적이고 혁신적인 작품들이 탄생할 것으로 예상됩니다. 이번 작품을 통해 제이슨 M. 앨런은 게임 기획자로서의 역량뿐만 아니라 AI를 활용한 창의적인 작품 제작 능력을 인정받았습니다.
이 작품이 입력된 명령어에 따라 만들어진 이미지를 예술로 인정할 수 있는지에 대한 쟁점이 있었지만, 이번 사건에서 우리가 정말 주목해야 할 것은 AI의 능력이 어디까지 발전하였는가이며, 이제 인간의 창작 영역에 발을 디뎌 더 나은 성과를 보이고 있다는 점입니다.
AI는 이제 인간 고유의 영역으로 여겨졌던 창작의 분야에도 도전하고 있으며, 때로는 인간보다 더 인간적이고 뛰어난 능력을 보이기도 합니다. 이번 사례는 인간과 AI의 창작 활동의 경계가 점점 모호해지고 있음을 보여주며, 앞으로 더 많은 분야에서 인간과 AI가 협력하여 창조적인 성과를 이루어낼 것으로 기대됩니다.
'콜로라도 주립 박람회 미술대회'의 디지털아트 부문에서 게임 기획자인 제이슨 M. 앨런(39)이 AI로 제작한 작품'스페이스 오페라 극장'(Theatre D'opera Spatial)
'AI 르네상스'의 태동
발달에 가속 붙은 AI, 새로운 시대는 곧 열릴까
10년 전에는 이미지 분류도 어려웠던 AI가 이제는 자유자재로 이미지를 생성하고 분류하는 등의 기술을 보유하고 있습니다.
AI의 발달 속도는 가속되고 있으며, 미래에는 우리가 상상하는 것 이상의 발전이 이루어질 것으로 예상됩니다. 이러한 AI의 발전은 새로운 르네상스 시대를 열 것이며, 다양한 분야에서 비약적인 발전을 이끌어낼 것으로 기대됩니다.
여러 장르에서 수준 높은 작문과 대화, 언어와 관련된 문제 풀이와 번역, 프로그래밍 언어를 이용한 코딩 등이 가능
동이 트는 들판에 앉아있는 여우의 모습, 모네의 화풍으로 작화
달리-1보다 더욱 사실적이고 정확한 이미지를 생성
최종 형태에 가까운 언어 모델이 될 것으로 예상, 더욱 향상된 언어 이해력과 구사력으로 사람과 구분되지 않는 수준의 대화가 가능할 것
전문적인 언어 능력과 복합적인 학습으로 고차원적인 사고와 추론이 가능한 AI, 다양한 분야에서 기술적 발전을 리드